물리적 세계와 상호작용하는 AI 모델은 사물이 어떻게 움직이고 공간에 존재하는지에 대한 데이터가 필요하지만, 언어 모델과 달리 긁어모을 수 있는 편리한 인터넷 텍스트 더미가 없다. 오리진랩이 등장했다. 이 회사는 라이트스피드 벤처스가 주도하고 SV 엔젤, 에니악, 세븐 스타즈, FPV가 참여한 800만 달러의 시드 펀딩을 유치했으며, 트위치 공동창업자 케빈 린과 크루즈 창업자 카일 보그트의 엔젤 투자도 포함된다.
이 스타트업의 제안은 간단하다: 비디오 게임 회사들은 물리와 움직임에 최적화된 디지털 자산을 대량 보유하고 있으며, 얀 르쿤의 AMI 연구소나 페이페이 리의 월드 연구소 같은 AI 연구소는 그 데이터를 사고 싶어 한다. 오리진랩은 중개인 역할을 하며 게임 자산을 사용 가능한 훈련 데이터로 변환한다. 단순한 렌더링 실행이든 수시간 분량의 워크스루 영상을 자동화하는 것이든.
"지금 구축되는 AI 시스템은 물리적 세계가 어떻게 작동하고 사물이 어떻게 움직이는지 이해해야 합니다," 공동 CEO 안-마르고 로드가 테크크런치에 말했다. "그 데이터는 본질적으로 비디오 게임에 있습니다." 회사의 다른 공동창업자는 앙투안 가르고와 콜랭 카리에다.
이 아이디어는 새롭지 않다. 연구소들은 오랫동안 비디오 게임 영상을 눈여겨봤지만, 라이선싱과 데이터 품질 문제가 장애물이었다. 2024년 12월, 오픈AI의 소라 비디오 모델이 인기 게임과 트위치 스트림의 영상을 재생산하는 듯한 사소한 스캔들을 일으켰는데, 아마도 그 데이터로 훈련되었기 때문일 것이다. 아마존도 모델 훈련에 트위치 영상을 사용하려는 의사를 공개적으로 밝혔다.
오리진의 800만 달러 조달은 주요 AI 연구소에 데이터를 공급하는 시장이 성장하고 있음을 시사한다. 투자를 주도한 라이트스피드 파트너 파라즈 파테미는 스케일 AI 같은 회사들이 자본이 풍부한 연구소에 서비스하는 데이터 공급업체의 수익이 얼마나 급격히 확장될 수 있는지 보여주었다고 언급했다. "그들 모두의 병목은 데이터입니다," 그가 말했다.