Modelele de IA care interacționează cu lumea fizică au nevoie de date despre cum se mișcă și există lucrurile în spațiu, dar, spre deosebire de modelele de limbaj, nu există o grămadă convenabilă de text de pe internet de răzuit. Intră în scenă Origin Lab, care a strâns 8 milioane de dolari într-o finanțare seed condusă de Lightspeed Ventures, cu participarea SV Angel, Eniac, Seven Stars și FPV, plus cecuri angel de la co-fondatorul Twitch, Kevin Lin, și fondatorul Cruise, Kyle Vogt.
Propunea startup-ului este simplă: companiile de jocuri video au tone de active digitale deja optimizate pentru fizică și mișcare, iar laboratoarele de IA precum AMI Labs al lui Yann LeCun sau World Labs al lui Fei-Fei Li ar fi încântate să cumpere acele date. Origin Lab acționează ca intermediar, convertind activele din jocuri în date de antrenament utilizabile – fie că e vorba de o simplă randare sau de automatizarea orelor de filmări walkthrough.
„Sistemele de IA care se construiesc acum trebuie să înțeleagă cum funcționează lumea fizică și cum se mișcă lucrurile,” a declarat pentru TechCrunch co-CEO Anne-Margot Rodde. „Datele acelea trăiesc, în esență, în jocurile video.” Ceilalți co-fondatori ai companiei sunt Antoine Gargot și Colin Carrier.
Ideea nu este nouă – laboratoarele s-au uitat de mult la filmările din jocuri video, dar problemele de licențiere și calitate a datelor au fost obstacole. În decembrie 2024, modelul video Sora al OpenAI a provocat un mic scandal regurgitând aparent filmări din jocuri populare și streamuri Twitch, probabil pentru că fusese antrenat pe ele. Amazon a fost, de asemenea, deschis cu privire la dorința de a folosi filmări Twitch pentru antrenarea modelelor.
Strângerea de 8 milioane de dolari a Origin semnalează o piață în creștere pentru furnizorii de date către marile laboratoare de IA. Partenerul Lightspeed, Faraz Fatemi, care a condus investiția, a remarcat că companii precum Scale AI au arătat cât de brusc pot scala veniturile pentru furnizorii de date care deservesc laboratoare bine capitalizate. „Blocajul pentru toate este datele,” a spus el.