Istnieje stary, oklepany slogan menedżerski: 'co jest mierzone, tym się zarządza', a inżynierowie oprogramowania od dziesięcioleci debatują, jak się mierzyć, zaczynając od klasycznej metryki 'linii kodu'. Teraz, gdy agenci AI do kodowania, tacy jak Claude Code, Cursor i Codex, zalewają repozytoria większą ilością kodu niż kiedykolwiek, menedżerowie zastanawiają się, co właściwie powinni liczyć. W dziwnej nowej grze statusowej, ogromne 'budżety tokenów' – ilość mocy obliczeniowej AI, którą programista ma prawo spalić – stały się odznaką honoru w Dolinie Krzemowej, co jest głęboko dziwnym sposobem myślenia o produktywności. Mierzenie nakładu ma niewielki sens, gdy prawdopodobnie zależy ci na wyniku, chyba że twoim celem jest po prostu zachęcenie do większej adopcji AI lub, wygodnie, sprzedanie większej liczby tokenów.
Nowa klasa firm 'developer productivity insight' dostarcza danych, które przebijają ten hype. Odkrywają, że chociaż programiści korzystający z narzędzi AI generują znacznie więcej zaakceptowanego kodu, muszą też znacznie częściej wracać, aby poprawić ten 'zaakceptowany' kod, co poważnie podważa wszelkie twierdzenia o boomie produktywnościowym. Alex Circei, CEO i założyciel Waydev, buduje warstwę inteligencji do śledzenia tych dynamik; jego firma współpracuje z 50 różnymi klientami zatrudniającymi ponad 10 000 inżynierów oprogramowania. Zauważa, że menedżerowie inżynieryjni widzą początkowe wskaźniki akceptacji kodu AI na poziomie 80% do 90%, ale przegapiają późniejszy churn, który obniża rzeczywisty, trwały wskaźnik akceptacji do zaledwie 10% do 30% wygenerowanego kodu.
Rozwój tych narzędzi sprawił, że Waydev, założony w 2017 roku w celu dostarczania analityki dla programistów, całkowicie przebudował swoją platformę w ciągu ostatnich sześciu miesięcy. Firma wprowadza teraz nowe narzędzia śledzące metadane generowane przez agentów AI, oferując analitykę dotyczącą jakości i kosztu ich kodu, aby dać menedżerom wgląd zarówno w adopcję AI, jak i jej rzeczywistą skuteczność. Chociaż firmy analityczne mają interes w znajdowaniu problemów do rozwiązania, dowody się mnożą, że duże organizacje nadal nie radzą sobie z wykorzystaniem narzędzi AI. Główni gracze zwracają na to uwagę – Atlassian przejął w zeszłym roku za miliard dolarów kolejny startup inżynieryjnej inteligencji, DX, aby pomóc swoim klientom zrozumieć zwrot z inwestycji w agentów kodujących.
Dane z całej branży opowiadają spójną i nieco przygnębiającą historię: pisze się więcej kodu, ale nieproporcjonalnie duża jego część się nie utrzymuje. GitClear opublikował w styczniu raport, z którego wynika, że chociaż narzędzia AI zwiększyły produktywność, jego dane pokazały, że 'regularni użytkownicy AI mieli średnio 9,4 razy wyższy churn kodu niż ich odpowiednicy niekorzystający z AI' – ponad dwukrotnie więcej niż zyski produktywnościowe zapewniane przez narzędzia. Faros AI, opierając się na danych klientów z dwóch lat dla swojego raportu z marca 2026 roku, stwierdził, że churn kodu – linie usunięte w porównaniu z dodanymi – wzrósł o oszałamiające 861% przy wysokiej adopcji AI.
Jellyfish, platforma inteligencji dla inżynierii zintegrowanej z AI, zebrała dane dotyczące 7548 inżynierów w pierwszym kwartale 2026 roku. Jej odkrycie było szczególnie wymowne: inżynierowie z największymi budżetami tokenów generowali najwięcej pull requestów, ale poprawa produktywności nie skaluje się. Osiągnęli dwukrotnie większą przepustowość przy dziesięciokrotnie wyższym koszcie tokenów. Innymi słowy, narzędzia generują objętość, a nie wartość. Te statystyki brzmią prawdziwie dla programistów, którzy zgłaszają, że przegląd kodu i dług techniczny piętrzą się, nawet gdy cieszą się nowo odkrytą wolnością generowania kodu w zawrotnym tempie.