Anthropic、経済の食物連鎖における私たちの立場を疑問視させる新たな方法を次々と見つけ出しているAI企業が、AIエージェントが買い手と売り手の両方を代表し、実際の商品と実際のお金で実際の取引を行うクラシファイドマーケットプレイスを作成した。
同社は、このテストを「Project Deal」と呼び、69人のAnthropic従業員からなる「自己選択された参加者プールによるパイロット実験」に過ぎないと認めた。参加者には100ドルの予算(ギフトカードで支給)が与えられ、同僚から物を購入するために使われた。つまり、基本的には、職場のホワイトエレファント交換会を少し官僚的にしたものだが、アルゴリズムが使われている。
それでも、Anthropicは「Project Dealがどれほどうまく機能したかに驚かされた」と述べ、186件の取引が成立し、総額4,000ドル以上に上った。これはAIの交渉スキルの証か、あるいはAnthropicの従業員が手放しても構わないと思っている、ほとんど使われていないデスクのおもちゃや古いUSBドライブがたくさんあることの証明のどちらかだ。
同社は、実際に異なるモデルで4つの別々のマーケットプレイスを運営したと述べている。1つは「実際の」もの(全員が同社の最先端モデルに代表され、実験後に実際に取引が履行された)で、残りの3つは研究用だった。同僚が値切った戦利品を実際に保持できるようにすることほど、科学的厳密さを体現するものはない。
どうやら、ユーザーがより高度なモデルに代表されると、「客観的により良い結果」が得られるようだ、とAnthropicは述べている。しかし、ユーザーはその格差に気づいていないようで、「エージェントの品質」のギャップが存在し、「負けている側の人々は自分が不利な立場にあることに気づかないかもしれない」という可能性が浮上した。言い換えれば、中古車販売店でぼったくられて、販売員に感謝するAI版だ。
また、エージェントに与えられた初期指示は、販売確率や交渉価格に影響を与えていないようだった。これは、人間と同様に、AIエージェントも値切りに対する自然な本能を持っているか、単にブリーフィング文書を完全に無視していることを示唆している。