인공지능 회사 Anthropic이 우리를 경제 먹이사슬에서의 위치를 의심하게 만드는 새로운 방법을 계속 찾아내고 있습니다. 이번에는 AI 에이전트가 구매자와 판매자 역할을 모두 수행하며 실제 상품과 실제 돈으로 거래를 성사시키는 중고품 거래 시장을 만들었습니다.
회사는 이 테스트(프로젝트 딜이라고 명명)가 "자발적으로 참여한 69명의 Anthropic 직원을 대상으로 한 파일럿 실험"에 불과하다고 인정했습니다. 직원들은 동료들로부터 물건을 사기 위해 100달러(기프트 카드로 지급)의 예산을 받았습니다. 즉, 기본적으로 직장 내 화이트 엘리펀트 교환 행사의 약간 더 관료적인 버전이지만, 알고리즘이 적용된 것입니다.
그럼에도 불구하고 Anthropic은 "프로젝트 딜이 얼마나 잘 작동했는지에 놀랐다"며 186건의 거래가 이루어졌고 총 가치는 4,000달러 이상이라고 밝혔습니다. 이는 AI 협상 능력을 증명하거나, 아니면 Anthropic 직원들이 처분할 의향이 있는 가벼운 책상 장난감과 오래된 USB 드라이브가 많다는 증거일 것입니다.
회사는 실제로 서로 다른 모델을 사용해 네 개의 개별 시장을 운영했다고 밝혔습니다. 하나는 "실제" 시장(모든 참가자가 회사의 가장 진보된 모델로 대표되었고, 실험 후 거래가 실제로 이행됨)이었고, 나머지 세 개는 연구용이었습니다. 동료들이 실제로 교환한 전리품을 가져갈 수 있게 하는 것보다 더 과학적 엄격함을 보여주는 것은 없겠죠.
분명히, 사용자가 더 진보된 모델로 대표될 때 "객관적으로 더 나은 결과"를 얻는다고 Anthropic은 말했습니다. 하지만 사용자들은 그 차이를 인식하지 못했으며, 이는 "에이전트 품질 격차"의 가능성을 제기합니다. 즉, "손해를 보는 쪽이 자신이 불리하다는 것을 깨닫지 못할 수도 있다"는 것입니다. 다시 말해, 중고차 매장에서 바가지를 쓰고도 판매자에게 감사 인사를 하는 AI 버전입니다.
또한, 에이전트에게 주어진 초기 지시사항은 판매 가능성이나 협상된 가격에 영향을 미치지 않는 것으로 나타났습니다. 이는 인간과 마찬가지로 AI 에이전트도 흥정에 대한 타고난 본능이 있거나, 브리핑 문서를 완전히 무시한다는 것을 시사합니다.