Il y a un vieux cliché managérial selon lequel ce qui est mesuré est géré, et les ingénieurs logiciels débattent depuis des décennies de la façon de se mesurer, en commençant par la métrique classique des 'lignes de code'. Maintenant, alors que les agents d'IA de codage comme Claude Code, Cursor et Codex inondent les dépôts de plus de code que jamais, les managers se demandent ce qu'ils devraient exactement compter. Dans un nouveau jeu de statut bizarre, d'énormes 'budgets de tokens' - la puissance de traitement d'IA qu'un développeur est autorisé à brûler - sont devenus un insigne d'honneur dans la Silicon Valley, ce qui est une façon profondément étrange de penser la productivité. Mesurer un intrant a peu de sens quand on se soucie présumément du résultat, à moins que votre objectif soit simplement d'encourager plus d'adoption d'IA ou, commodément, de vendre plus de tokens.
Une nouvelle classe d'entreprises d''insights de productivité des développeurs' fournit les données pour crever cette bulle de hype. Elles constatent que si les développeurs utilisant des outils d'IA génèrent beaucoup plus de code accepté, ils doivent aussi revenir réviser ce code 'accepté' bien plus souvent, ce qui sape sérieusement toute prétention à un boom de productivité. Alex Circei, PDG et fondateur de Waydev, construit une couche d'intelligence pour suivre ces dynamiques ; sa firme travaille avec 50 clients différents employant plus de 10 000 ingénieurs logiciels. Il note que les managers d'ingénierie voient des taux d'acceptation initiaux du code d'IA de 80% à 90%, mais ils manquent le churn subséquent, ce qui fait chuter le taux d'acceptation réel et durable à seulement 10% à 30% du code généré.
L'essor de ces outils a conduit Waydev, fondée en 2017 pour fournir des analyses de développeurs, à totalement retravailler sa plateforme ces six derniers mois. L'entreprise publie maintenant de nouveaux outils qui suivent les métadonnées générées par les agents d'IA, offrant des analyses sur la qualité et le coût de leur code pour donner aux managers un aperçu à la fois de l'adoption de l'IA et de son efficacité réelle. Bien que les firmes d'analyse aient un intérêt personnel à trouver des problèmes à résoudre, les preuves s'accumulent que les grandes organisations tâtonnent encore dans leur usage des outils d'IA. Les grands acteurs prennent note - Atlassian a acquis une autre startup d'intelligence d'ingénierie, DX, pour 1 milliard de dollars l'année dernière pour aider ses clients à comprendre le retour sur investissement des agents de codage.
Les données de toute l'industrie racontent une histoire cohérente et légèrement déprimante : plus de code est écrit, mais une quantité disproportionnée ne tient pas. GitClear a publié un rapport en janvier constatant que si les outils d'IA augmentaient la productivité, ses données montraient que 'les utilisateurs réguliers d'IA avaient en moyenne 9,4 fois plus de churn de code que leurs homologues non-IA' - plus du double des gains de productivité fournis par les outils. Faros AI, s'appuyant sur deux ans de données clients pour son rapport de mars 2026, a constaté que le churn de code - lignes supprimées versus lignes ajoutées - avait augmenté de 861% sous une forte adoption d'IA.
Jellyfish, une plateforme d'intelligence pour l'ingénierie intégrée à l'IA, a collecté des données sur 7 548 ingénieurs au premier trimestre 2026. Sa découverte était particulièrement révélatrice : les ingénieurs avec les plus gros budgets de tokens produisaient le plus de pull requests, mais l'amélioration de productivité ne suivait pas l'échelle. Ils atteignaient deux fois le débit à dix fois le coût en tokens. En d'autres termes, les outils génèrent du volume, pas de la valeur. Ces statistiques sonnent vrai pour les développeurs qui rapportent que la revue de code et la dette technique s'accumulent, même s'ils apprécient la liberté nouvelle de générer du code à un rythme effréné.