Det finns ett gammalt management-kliche om att det som mäts blir hanterat, och mjukvaruutvecklare har debatterat hur de ska mäta sig själva i decennier, med början i det klassiska 'rader kod'-måttet. Nu när AI-kodagenter som Claude Code, Cursor och Codex översvämmar kodförråd med mer kod än någonsin, står cheferna och undrar vad de egentligen ska räkna. I ett bisarrt nytt statusspel har enorma 'token-budgetar' – mängden AI-processorkraft en utvecklare är auktoriserad att bränna – blivit en hedersbricka i Silicon Valley, vilket är ett djupt konstigt sätt att tänka på produktivitet. Att mäta en input är meningslöst när man förmodligen bryr sig om outputen, såvida inte målet helt enkelt är att uppmuntra mer AI-användning eller, bekvämt nog, sälja fler tokens.
En ny klass av 'utvecklarproduktivitetsinsikts'-företag tillhandahåller data för att punktera denna hype. De upptäcker att medan utvecklare som använder AI-verktyg genererar mycket mer accepterad kod, måste de också återvända för att revidera den 'accepterade' koden betydligt oftare, vilket allvarligt undergräver alla påståenden om en produktivitetsboom. Alex Circei, VD och grundare av Waydev, bygger ett intelligenslager för att spåra dessa dynamiker; hans företag arbetar med 50 olika kunder som anställer över 10 000 mjukvaruutvecklare. Han noterar att ingenjörschefer ser initiala AI-kodacceptansrater på 80 % till 90 %, men de missar det efterföljande omslaget, vilket driver den verkliga, bestående acceptansraten ner till bara mellan 10 % och 30 % av den genererade koden.
Uppkomsten av dessa verktyg ledde Waydev, grundat 2017 för att tillhandahålla utvecklaranalys, att totalt omarbeta sin plattform under de senaste sex månaderna. Företaget släpper nu nya verktyg som spårar metadata genererad av AI-agenter, erbjuder analyser av kvaliteten och kostnaden för deras kod för att ge chefer insikt i både AI-adoption och dess faktiska effektivitet. Medan analysföretag har ett egenintresse av att hitta problem att lösa, växer bevisen att stora organisationer fortfarande fumlar med sin AI-verktygsanvändning. Stora aktörer tar notis – Atlassian förvärvade ett annat ingenjörsintelligensstartup, DX, för 1 miljard dollar förra året för att hjälpa sina kunder att förstå avkastningen på kodagenter.
Data från hela branschen berättar en konsekvent och något deprimerande historia: mer kod skrivs, men en oproportionerlig mängd av den håller inte. GitClear publicerade en rapport i januari som fann att medan AI-verktyg ökade produktiviteten, visade dess data att 'regelbundna AI-användare i genomsnitt hade 9,4 gånger högre kodomslag än sina icke-AI-kollegor' – mer än dubbelt så mycket som produktivitetsvinsterna verktygen gav. Faros AI, som drog på två års kunddata för sin mars 2026-rapport, fann att kodomslag – rader borttagna kontra rader tillagda – hade ökat med en häpnadsväckande 861 % under hög AI-adoption.
Jellyfish, en intelligensplattform för AI-integrerad ingenjörskonst, samlade data på 7 548 ingenjörer under Q1 2026. Dess fynd var särskilt talande: ingenjörer med de största token-budgetarna producerade flest pull requests, men produktivitetsförbättringen skalerade inte. De uppnådde två gånger genomströmningen till tio gånger kostnaden för tokens. Med andra ord genererar verktygen volym, inte värde. Dessa statistik svarar mot utvecklare som rapporterar att kodgranskning och teknisk skuld hopar sig, även när de njuter av den nyfunna friheten att generera kod i rasande takt.