C'è un vecchio cliché manageriale secondo cui ciò che viene misurato viene gestito, e gli ingegneri del software dibattono da decenni su come misurare se stessi, partendo dalla classica metrica delle 'righe di codice'. Ora, mentre agenti di codifica AI come Claude Code, Cursor e Codex inondano i repository con più codice che mai, i manager si chiedono cosa, esattamente, dovrebbero contare. In un bizzarro nuovo gioco di status, enormi 'budget di token' - la quantità di potenza di elaborazione AI che uno sviluppatore è autorizzato a bruciare - sono diventati un distintivo d'onore nella Silicon Valley, il che è un modo profondamente strano di pensare alla produttività. Misurare un input ha poco senso quando presumibilmente ci si preoccupa dell'output, a meno che il tuo obiettivo non sia semplicemente incoraggiare una maggiore adozione dell'AI o, comodamente, vendere più token.

Una nuova classe di aziende di 'insight sulla produttività degli sviluppatori' sta fornendo i dati per sfatare questo clamore. Stanno scoprendo che mentre gli sviluppatori che utilizzano strumenti AI generano molto più codice accettato, devono anche tornare a rivedere quel codice 'accettato' molto più spesso, il che compromette seriamente qualsiasi affermazione di boom di produttività. Alex Circei, CEO e fondatore di Waydev, sta costruendo uno strato di intelligenza per tracciare queste dinamiche; la sua azienda lavora con 50 clienti diversi che impiegano oltre 10.000 ingegneri del software. Egli nota che i manager di ingegneria vedono tassi di accettazione iniziale del codice AI dell'80% al 90%, ma perdono i successivi rimaneggiamenti, che portano il tasso di accettazione reale e duraturo a solo il 10% e il 30% del codice generato.

L'ascesa di questi strumenti ha portato Waydev, fondata nel 2017 per fornire analisi agli sviluppatori, a ristrutturare completamente la sua piattaforma negli ultimi sei mesi. L'azienda sta ora rilasciando nuovi strumenti che tracciano i metadati generati dagli agenti AI, offrendo analisi sulla qualità e sul costo del loro codice per dare ai manager una visione sia dell'adozione dell'AI che della sua effettiva efficacia. Mentre le aziende di analisi hanno un interesse acquisito nel trovare problemi da risolvere, le prove si accumulano che le grandi organizzazioni stanno ancora pasticciando con l'uso dei loro strumenti AI. I grandi attori stanno prendendo nota - Atlassian ha acquisito un'altra startup di intelligenza ingegneristica, DX, per 1 miliardo di dollari l'anno scorso per aiutare i suoi clienti a comprendere il ritorno sull'investimento degli agenti di codifica.

I dati di tutto il settore raccontano una storia coerente e leggermente deprimente: viene scritto più codice, ma una quantità sproporzionata di esso non rimane. GitClear ha pubblicato un rapporto a gennaio scoprendo che mentre gli strumenti AI aumentavano la produttività, i suoi dati mostravano che 'gli utenti regolari di AI avevano in media un rimaneggiamento del codice 9,4 volte superiore rispetto ai loro colleghi non AI' - più del doppio dei guadagni di produttività forniti dagli strumenti. Faros AI, attingendo a due anni di dati dei clienti per il suo rapporto di marzo 2026, ha scoperto che il rimaneggiamento del codice - righe eliminate rispetto a righe aggiunte - era aumentato di uno sbalorditivo 861% con un'elevata adozione dell'AI.

Jellyfish, una piattaforma di intelligenza per l'ingegneria integrata con l'AI, ha raccolto dati su 7.548 ingegneri nel primo trimestre del 2026. La sua scoperta è stata particolarmente rivelatrice: gli ingegneri con i budget di token più grandi producevano il maggior numero di pull request, ma il miglioramento della produttività non si scalava. Raggiungevano due volte la produttività a dieci volte il costo dei token. In altre parole, gli strumenti generano volume, non valore. Queste statistiche suonano vere per gli sviluppatori che riferiscono che la revisione del codice e il debito tecnico si accumulano, anche mentre godono della nuova libertà di generare codice a un ritmo frenetico.