「測定されるものが管理される」という古い経営の決まり文句があるが、ソフトウェアエンジニアたちは何十年も、古典的な「コード行数」指標から始まり、自分たちをどう測定すべきか議論してきた。今や、Claude Code、Cursor、CodexなどのAIコーディングエージェントがリポジトリにこれまで以上に大量のコードを溢れさせている中、マネージャーたちは一体何を数えるべきか途方に暮れている。奇妙な新たなステータスゲームでは、膨大な「トークン予算」――開発者が使用を許可されたAI処理能力の量――がシリコンバレーで名誉の証となっており、これは生産性について考える上で非常に奇妙な方法だ。出力を気にしているはずなのに、入力を測定することはほとんど意味をなさない。あなたの目標が単にAI導入を促進すること、あるいは都合よく、より多くのトークンを売ることであるなら別だが。
新たな「開発者生産性インサイト」企業の一群が、この誇大広告を突き崩すデータを提供している。彼らは、AIツールを使用する開発者がはるかに多くの承認コードを生成する一方で、その「承認された」コードを修正するために戻らなければならない頻度もはるかに高く、これが生産性ブームの主張を深刻に損なっていることを発見している。WaydevのCEO兼創業者であるAlex Circeiは、これらの動態を追跡するインテリジェンス層を構築している。彼の会社は、10,000人以上のソフトウェアエンジニアを雇用する50の異なる顧客と協力している。彼は、エンジニアリングマネージャーが初期のAIコード承認率80%から90%を見ているが、その後の変更を見逃しており、それが現実世界での持続的な承認率を生成コードのわずか10%から30%にまで押し下げていると指摘する。
これらのツールの台頭により、開発者分析を提供するために2017年に設立されたWaydevは、過去6か月でプラットフォームを完全に作り直した。同社は現在、AIエージェントによって生成されたメタデータを追跡し、そのコードの品質とコストに関する分析を提供して、マネージャーにAI導入とその実際の有効性の両方について洞察を与える新たなツールをリリースしている。分析企業は解決すべき問題を見つけることに利害関係があるが、大規模組織が依然としてAIツールの使用に手間取っているという証拠が積み上がっている。主要プレイヤーも注目しており、Atlassianは昨年、顧客がコーディングエージェントへの投資収益率を理解するのを支援するために、別のエンジニアリングインテリジェンススタートアップであるDXを10億ドルで買収した。
業界全体のデータは、一貫しており、やや憂鬱な物語を語っている:より多くのコードが書かれているが、不釣り合いに多くのコードが定着していない。GitClearは1月に報告書を発表し、AIツールが生産性を向上させた一方で、そのデータは「定期的なAIユーザーは非AIユーザーに比べて9.4倍高いコード変更を平均した」ことを示した――ツールが提供した生産性向上の2倍以上だ。Faros AIは、2026年3月の報告書のために2年間の顧客データを基に、コード変更――追加された行に対する削除された行――が高いAI導入下で驚異的な861%増加したことを発見した。
AI統合エンジニアリングのためのインテリジェンスプラットフォームであるJellyfishは、2026年第1四半期に7,548人のエンジニアに関するデータを収集した。その発見は特に示唆に富んでいた:最大のトークン予算を持つエンジニアが最も多くのプルリクエストを生成したが、生産性の向上は規模に応じて拡大しなかった。彼らは、トークンコストの10倍のコストで2倍のスループットを達成した。言い換えれば、ツールは量を生成しているのであって、価値を生成しているのではない。これらの統計は、猛烈なペースでコードを生成する新たな自由を享受しながらも、コードレビューと技術的負債が積み上がっていると報告する開発者たちに真実味を帯びて響く。