A Anthropic, a empresa de IA que não para de encontrar novas maneiras de nos fazer questionar nosso lugar na cadeia alimentar econômica, criou um mercado classificado onde agentes de IA representavam tanto compradores quanto vendedores, fechando negócios reais por produtos reais e dinheiro real.
A empresa admitiu que este teste — que chamou de Projeto Deal — foi apenas “um experimento piloto com um grupo de participantes auto-selecionado” de 69 funcionários da Anthropic que receberam um orçamento de $100 (pagos via cartões-presente) para comprar coisas de seus colegas de trabalho. Então, basicamente, uma versão ligeiramente mais burocrática de um amigo secreto de escritório, mas com algoritmos.
Mesmo assim, a Anthropic disse que ficou “impressionada com o quão bem o Projeto Deal funcionou”, com 186 negócios fechados, totalizando mais de $4.000 em valor. O que é ou um testemunho das habilidades de negociação da IA ou uma prova de que os funcionários da Anthropic têm muitos brinquedos de mesa levemente usados e pendrives velhos que estão dispostos a vender.
A empresa disse que na verdade executou quatro mercados diferentes com modelos distintos — um que era “real” (onde todos eram representados pelo modelo mais avançado da empresa, e com negócios realmente honrados após o experimento) e outros três para estudo. Porque nada diz rigor científico como deixar seus colegas ficarem com o butim que eles negociaram.
Aparentemente, quando os usuários são representados por modelos mais avançados, eles obtêm “resultados objetivamente melhores”, disse a Anthropic. Mas os usuários não pareciam notar a disparidade, levantando a possibilidade de “‘lacunas de qualidade’ dos agentes” onde “as pessoas no lado perdedor podem não perceber que estão em desvantagem”. Em outras palavras, a versão IA de ser enganado num stand de carros usados e agradecer ao vendedor.
Além disso, as instruções iniciais dadas aos agentes não pareceram afetar a probabilidade de venda ou os preços negociados. O que sugere que, assim como os humanos, os agentes de IA ou têm um instinto natural para pechinchar ou simplesmente ignoram completamente seus documentos de briefing.