有个老掉牙的管理格言说:能被衡量的才能被管理。几十年来,软件工程师们一直在争论如何衡量自己,从经典的“代码行数”指标开始。如今,随着Claude Code、Cursor和Codex等AI编程助手向代码库倾泻比以往任何时候都多的代码,经理们不禁要问:他们到底该数什么?在一场诡异的新地位游戏中,庞大的“令牌预算”——开发者被授权消耗的AI处理能力——已成为硅谷的荣誉徽章,这真是一种对生产力的奇葩理解方式。当你理应关心产出时,衡量输入几乎没有意义,除非你的目标仅仅是鼓励更多AI采用,或者——方便地——卖出更多令牌。
一类新的“开发者生产力洞察”公司正在提供数据来戳破这种炒作。他们发现,虽然使用AI工具的开发者生成了更多被接受的代码,但他们也不得不更频繁地回头修改那些“被接受”的代码,这严重削弱了任何关于生产力爆发的说法。Waydev的CEO兼创始人Alex Circei正在构建一个智能层来追踪这些动态;他的公司与50家不同客户合作,雇佣了超过10,000名软件工程师。他指出,工程经理们看到AI代码的初始接受率在80%到90%之间,但他们忽略了随后的代码流失,这使得真实世界、持久的接受率降至仅生成代码的10%到30%。
这些工具的兴起促使成立于2017年、旨在提供开发者分析的Waydev在过去六个月里彻底改造了其平台。该公司现在正在发布新工具,追踪AI代理生成的元数据,提供关于其代码质量和成本的分析,让经理们深入了解AI采用及其实际效果。尽管分析公司有发现待解决问题的既得利益,但越来越多的证据表明,大型组织仍在笨拙地使用AI工具。主要参与者已经注意到了这一点——Atlassian去年以10亿美元收购了另一家工程智能初创公司DX,以帮助其客户理解编程代理的投资回报。
来自整个行业的数据讲述了一个一致且略显沮丧的故事:编写的代码更多了,但不成比例的部分并未留存。GitClear在一月份发布了一份报告,发现虽然AI工具提高了生产力,但其数据显示“常规AI用户的代码流失率平均比非AI用户高9.4倍”——超过这些工具提供的生产力增益的两倍。Faros AI根据其2026年3月报告的两年客户数据发现,在高AI采用率下,代码流失——删除行数与添加行数之比——惊人地增加了861%。
Jellyfish,一个用于AI集成工程的智能平台,在2026年第一季度收集了7,548名工程师的数据。其发现尤其发人深省:拥有最大令牌预算的工程师提交了最多的拉取请求,但生产力提升并未按比例增长。他们以十倍令牌成本实现了两倍的吞吐量。换句话说,这些工具产生的是数量,而非价值。这些统计数据与开发者的报告相符:他们报告称代码审查和技术债务正在堆积,尽管他们享受着以惊人速度生成代码的新自由。