マイクロソフトAI責任者、「ほぼ人間レベルのエージェント」が来ると語る – ただし、適切に餌をやるのを忘れずに

マイクロソフトのAI責任者はほぼ人間レベルのエージェントが間近だと語るが、その前にデータの制御、出力の評価、そしてコストを賄えるかどうかを考える必要がある。

マイクロソフトのAI責任者ムスタファ・スレイマン氏は最近、MITテクノロジーレビューで、コンピューティングが「ほぼ人間レベルのエージェント」の閾値に達していると宣言した。素晴らしいことだ。ただし、それらが誤ってあなたの医療記録を見知らぬ人にメールで送信しないようにする方法を考え出せればの話だが。

Databricksの「State of AI Agents」レポートによると、AIエージェントを導入している組織はわずか19％で、それもほとんどが限定的な範囲だ。DatabricksのAI責任者クレイグ・ワイリー氏はZDNETに対し、CFOには3つの懸念事項があると語った：制御、品質、コスト。つまり、基本的には10代の子供に対するのと同じ懸念だが、データ漏洩のリスクがより大きい。

ワイリー氏の最初のベストプラクティスはガバナンスだ。具体的には、エージェントがアクセスできるデータを制御すること。彼は女性の健康アプリFlowを例に挙げた。同アプリは7500万人のユーザーを抱え、ある人の排卵チャートを別の人のものと混同することを正当に恐れている。「アプリユーザーが他のユーザーの情報を含む応答を受け取ることは、彼らが最も避けたいことだ」とワイリー氏は、データ漏洩の見出しを見たことのない男の控えめな表現で語った。

資産運用会社フランクリン・テンプルトンもポートフォリオレポートで同様の課題に直面している。「親愛なる顧客様、こちらは他の誰かの純資産です」で始まるメールをファイナンシャルアドバイザーから受け取りたい人はいない。ワイリー氏は、データのセグメンテーションは「決定論的に強制」されなければならず、プロンプトで単に提案するだけでは不十分だと強調する。なぜならAIは、気の散ったインターンのように、最も抵抗の少ない道を進むからだ。

2つ目のプラクティスは評価だ。Flowの開発者が正確性を確保する必要があったとき、彼らはプログラマーに出力を判断させるのではなく、実際の医師に依頼した。「ソフトウェアプログラマーはオーケストレーションシステムと呼ばれるものを書きますが、『この応答には追加のコンテキストや色付けが必要だ』と言うのは医師たちです」とワイリー氏は説明した。評価は継続的に行うべきで、最終的な回答だけでなく、エージェントの思考の中間ステップもチェックする。これを行う企業はエージェントを本番環境に導入する可能性が6倍高い。これは評価の証か、他の全員に対する痛烈な非難か。

3つ目の懸念であるコストは、基本的に最初の2つを正しく行うことへの報酬だ。「これら2つができれば、正直なところ、残りは実装の詳細になります」とワイリー氏は言う。しかし、コストは事前に考慮しなければならない：「これは今日、妥当なコスト範囲内で解決できるものか？そして解決できると仮定して、実際に会社の業績に影響を与えるのか？」

ワイリー氏は小さく始めることを勧めている。コンビニエンスストアチェーンのセブン-イレブンは、サービス技術者向けに「スーパーアシスタント」を構築し、機器に関する大量のドキュメントにアクセスできるようにして、仲間に「この問題を見たことある？」と電話する必要性を減らした。結果：初回修理成功率が25％向上し、修理時間が40％短縮された。ベイラー大学はエージェントを使用して、将来の学生との通話記録をレビューし、人間のノートテイカーが必然的に見逃す意思決定要因を分析している。

フランクリン・テンプルトンによる投資ポートフォリオ分析の自動化は、1500万ドル以上の新製品機会を特定した。おそらく、人間が忙しすぎて見えなかったクライアントポートフォリオのギャップに気づいたのだろう。

ワイリー氏は現在のエージェントAIの状態を「ウェブの2001年に相当し、企業がウェブページに投資しているが、これの目的をまだ理解していない」と比較している。重要なポイント：まずデータを整頓せよ。「データの状態が良ければ、今日の午後にもエージェントシステムを構築して展開できます」とワイリー氏は言う。「データの状態が悪ければ、本当の問題はデータを整頓するのにどれだけ時間がかかるかです。」

つまり、ほぼ人間レベルのエージェントへの道は、クリーンなデータ、厳格な評価、そしてAIが誤ってあなたの最も深い秘密を見知らぬ人に漏らさないという永遠の希望で舗装されている。未来へようこそ。

マイクロソフトAI責任者、「ほぼ人間レベルのエージェント」が来ると語る – ただし、適切に餌をやるのを忘れずに

ニュースをメールで。