Er is een oud managementcliché dat wat gemeten wordt, ook beheerd wordt, en softwareontwikkelaars debatteren al decennia over hoe ze zichzelf moeten meten, te beginnen met de klassieke 'regels code'-metriek. Nu AI-coderingsagenten zoals Claude Code, Cursor en Codex repositories overspoelen met meer code dan ooit, vragen managers zich af wat ze precies moeten tellen. In een bizar nieuw statusspel zijn enorme 'tokenbudgetten' - de hoeveelheid AI-verwerkingskracht die een ontwikkelaar mag verbranden - een ereteken geworden in Silicon Valley, wat een diepgaand vreemde manier is om over productiviteit na te denken. Het meten van een input heeft weinig zin als je vermoedelijk om de output geeft, tenzij je doel simpelweg is om meer AI-adoptie aan te moedigen of, handig genoeg, meer tokens te verkopen.

Een nieuwe klasse van 'developerproductiviteitsinzicht'-bedrijven levert de gegevens om deze hype te doorprikken. Ze ontdekken dat hoewel ontwikkelaars die AI-tools gebruiken veel meer geaccepteerde code genereren, ze ook veel vaker terug moeten komen om die 'geaccepteerde' code te herzien, wat elke claim van een productiviteitsboom ernstig ondermijnt. Alex Circei, CEO en oprichter van Waydev, bouwt een intelligentielaag om deze dynamiek te volgen; zijn bedrijf werkt met 50 verschillende klanten die meer dan 10.000 softwareontwikkelaars in dienst hebben. Hij merkt op dat technische managers aanvankelijke AI-codeacceptatiepercentages van 80% tot 90% zien, maar dat ze het daaropvolgende verloop missen, waardoor het werkelijke, blijvende acceptatiepercentage daalt tot slechts 10% tot 30% van de gegenereerde code.

De opkomst van deze tools leidde ertoe dat Waydev, opgericht in 2017 om ontwikkelaarsanalyses te leveren, zijn platform de afgelopen zes maanden volledig heeft herzien. Het bedrijf brengt nu nieuwe tools uit die de metadata volgen die door AI-agenten worden gegenereerd, en biedt analyses over de kwaliteit en kosten van hun code om managers inzicht te geven in zowel AI-adoptie als de daadwerkelijke effectiviteit ervan. Hoewel analysebedrijven een gevestigd belang hebben bij het vinden van problemen om op te lossen, stapelt het bewijs zich op dat grote organisaties hun AI-toolgebruik nog steeds verknoeien. Grote spelers nemen nota - Atlassian verwierf vorig jaar een andere technische intelligentie-startup, DX, voor $1 miljard om zijn klanten te helpen het rendement op investering in coderingsagenten te begrijpen.

De gegevens uit de hele industrie vertellen een consistent en enigszins deprimerend verhaal: er wordt meer code geschreven, maar een onevenredige hoeveelheid blijft niet hangen. GitClear publiceerde in januari een rapport waaruit bleek dat hoewel AI-tools de productiviteit verhoogden, de gegevens lieten zien dat 'regelmatige AI-gebruikers gemiddeld 9,4x hoger codeverloop hadden dan hun niet-AI-tegenhangers' - meer dan het dubbele van de productiviteitswinst die de tools opleverden. Faros AI, puttend uit twee jaar klantgegevens voor zijn rapport van maart 2026, ontdekte dat codeverloop - verwijderde regels versus toegevoegde regels - met een verbijsterende 861% was toegenomen bij hoge AI-adoptie.

Jellyfish, een intelligentieplatform voor AI-geïntegreerde techniek, verzamelde in het eerste kwartaal van 2026 gegevens over 7.548 ingenieurs. De bevinding was bijzonder veelzeggend: ingenieurs met de grootste tokenbudgetten produceerden de meeste pull-verzoeken, maar de productiviteitsverbetering schaalde niet mee. Ze bereikten twee keer de doorvoer tegen tien keer de kosten van tokens. Met andere woorden, de tools genereren volume, niet waarde. Deze statistieken klinken bekend bij ontwikkelaars die melden dat codereview en technische schuld zich opstapelen, zelfs terwijl ze genieten van de nieuw gevonden vrijheid om code in een razend tempo te genereren.