AI-modeller som interagerar med den fysiska världen behöver data om hur saker rör sig och existerar i rymden, men till skillnad från språkmodeller finns det ingen bekväm hög med internettext att skrapa. Gå in Origin Lab, som har samlat in 8 miljoner dollar i såddinvesteringar ledda av Lightspeed Ventures, med deltagande från SV Angel, Eniac, Seven Stars och FPV, plus änglacheckar från Twitch-medgrundaren Kevin Lin och Cruise-grundaren Kyle Vogt.

Startupens pitch är enkel: tv-spelsföretag har massor av digitala tillgångar som redan är optimerade för fysik och rörelse, och AI-labb som Yann LeCuns AMI Labs eller Fei-Fei Lis World Labs skulle älska att köpa den datan. Origin Lab agerar mellanhand och omvandlar speltillgångar till användbar träningsdata – vare sig det är en enkel renderingskörning eller automatisering av timmar av genomspelningsmaterial.

”De AI-system som byggs nu behöver förstå hur den fysiska världen fungerar och hur saker rör sig”, sa med-VD Anne-Margot Rodde till TechCrunch. ”Den datan finns i princip i tv-spel.” Företagets andra medgrundare är Antoine Gargot och Colin Carrier.

Idén är inte ny – labb har länge sneglat på tv-spelsmaterial, men licens- och datakvalitetsproblem har varit hinder. I december 2024 orsakade OpenAIs Sora-videomodell en mindre skandal genom att uppenbarligen regurgitera material från populära spel och Twitch-strömmar, förmodligen för att den hade tränats på dem. Amazon har också varit öppna med att vilja använda Twitch-material för modellträning.

Origin Labs insamling på 8 miljoner dollar signalerar en växande marknad för dataleverantörer till stora AI-labb. Lightspeed-partnern Faraz Fatemi, som ledde investeringen, noterade att företag som Scale AI har visat hur kraftfullt intäkterna kan skalas för dataleverantörer som betjänar välfinansierade labb. ”Flaskhalsen för dem alla är data”, sa han.