Existe um clichê gerencial antigo de que o que é medido é gerenciado, e engenheiros de software debatem há décadas como se medir, começando com a clássica métrica de 'linhas de código'. Agora, enquanto agentes de codificação IA como Claude Code, Cursor e Codex inundam repositórios com mais código do que nunca, os gerentes ficam se perguntando o que, exatamente, deveriam estar contando. Em um bizarro novo jogo de status, enormes 'orçamentos de tokens' - a quantidade de poder de processamento de IA que um desenvolvedor está autorizado a queimar - tornaram-se uma insígnia de honra no Vale do Silício, o que é uma forma profundamente estranha de pensar sobre produtividade. Medir um insumo faz pouco sentido quando você presumivelmente se importa com o resultado, a menos que seu objetivo seja simplesmente incentivar mais adoção de IA ou, convenientemente, vender mais tokens.
Uma nova classe de empresas de 'insights de produtividade do desenvolvedor' está fornecendo dados para estourar esse hype. Elas estão descobrindo que, enquanto desenvolvedores usando ferramentas de IA geram muito mais código aceito, eles também precisam retornar para revisar esse código 'aceito' com muito mais frequência, o que prejudica seriamente qualquer alegação de um boom de produtividade. Alex Circei, CEO e fundador da Waydev, está construindo uma camada de inteligência para rastrear essas dinâmicas; sua empresa trabalha com 50 clientes diferentes empregando mais de 10.000 engenheiros de software. Ele observa que gerentes de engenharia veem taxas iniciais de aceitação de código IA de 80% a 90%, mas perdem a revisão subsequente, que reduz a taxa de aceitação real e duradoura para apenas 10% a 30% do código gerado.
A ascensão dessas ferramentas levou a Waydev, fundada em 2017 para fornecer análises de desenvolvedores, a reformular totalmente sua plataforma nos últimos seis meses. A empresa agora está lançando novas ferramentas que rastreiam os metadados gerados por agentes de IA, oferecendo análises sobre a qualidade e o custo de seu código para dar aos gerentes insights sobre tanto a adoção de IA quanto sua eficácia real. Embora empresas de análise tenham interesse próprio em encontrar problemas para resolver, as evidências estão se acumulando de que grandes organizações ainda estão tropeçando no uso de suas ferramentas de IA. Grandes players estão tomando nota - a Atlassian adquiriu outra startup de inteligência de engenharia, DX, por US$ 1 bilhão no ano passado para ajudar seus clientes a entender o retorno sobre o investimento em agentes de codificação.
Os dados de toda a indústria contam uma história consistente e ligeiramente deprimente: mais código está sendo escrito, mas uma quantidade desproporcional dele não está pegando. A GitClear publicou um relatório em janeiro descobrindo que, embora as ferramentas de IA aumentassem a produtividade, seus dados mostraram que 'usuários regulares de IA tiveram em média 9,4x mais revisão de código do que seus colegas não-IA' - mais que o dobro dos ganhos de produtividade que as ferramentas forneceram. A Faros AI, baseando-se em dois anos de dados de clientes para seu relatório de março de 2026, descobriu que a revisão de código - linhas excluídas versus linhas adicionadas - havia aumentado impressionantes 861% sob alta adoção de IA.
A Jellyfish, uma plataforma de inteligência para engenharia integrada com IA, coletou dados sobre 7.548 engenheiros no primeiro trimestre de 2026. Sua descoberta foi particularmente reveladora: engenheiros com os maiores orçamentos de tokens produziram os maiores números de pull requests, mas a melhoria de produtividade não escalou. Eles alcançaram duas vezes a taxa de produção a dez vezes o custo de tokens. Em outras palavras, as ferramentas estão gerando volume, não valor. Essas estatísticas soam verdadeiras para desenvolvedores que relatam que revisão de código e dívida técnica estão se acumulando, mesmo enquanto desfrutam da nova liberdade de gerar código em ritmo acelerado.