Modele AI, które wchodzą w interakcję z fizycznym światem, potrzebują danych o tym, jak rzeczy się poruszają i istnieją w przestrzeni, ale w przeciwieństwie do modeli językowych, nie ma wygodnej sterty internetowego tekstu do zeskrobania. Wkracza Origin Lab, które zebrało 8 milionów dolarów w finansowaniu zalążkowym prowadzonym przez Lightspeed Ventures, z udziałem SV Angel, Eniac, Seven Stars i FPV, plus czeki aniołów od współzałożyciela Twitcha Kevina Lina i założyciela Cruise Kyle'a Vogta.
Propozycja startupu jest prosta: firmy produkujące gry wideo mają mnóstwo cyfrowych zasobów już zoptymalizowanych pod kątem fizyki i ruchu, a laboratoria AI, takie jak AMI Labs Yanna LeCuna czy World Labs Fei-Fei Li, chętnie kupiłyby te dane. Origin Lab działa jako pośrednik, przekształcając zasoby gier w użyteczne dane treningowe – czy to prosty rendering, czy automatyzacja godzin nagrań z rozgrywki.
„Systemy AI budowane teraz muszą rozumieć, jak działa fizyczny świat i jak rzeczy się poruszają” – powiedziała TechCrunch współdyrektor generalna Anne-Margot Rodde. „Te dane zasadniczo żyją w grach wideo”. Inni współzałożyciele firmy to Antoine Gargot i Colin Carrier.
Pomysł nie jest nowy – laboratoria od dawna mierzyły w nagrania z gier, ale przeszkodami były kwestie licencyjne i jakości danych. W grudniu 2024 roku model wideo OpenAI Sora wywołał mały skandal, najwyraźniej odtwarzając nagrania z popularnych gier i transmisji Twitch, prawdopodobnie dlatego, że był na nich trenowany. Amazon również otwarcie mówił o chęci wykorzystania nagrań z Twitcha do trenowania modeli.
8-milionowa zbiórka Origin sygnalizuje rosnący rynek dla dostawców danych dla głównych laboratoriów AI. Partner Lightspeed Faraz Fatemi, który prowadził inwestycję, zauważył, że firmy takie jak Scale AI pokazały, jak gwałtownie mogą rosnąć przychody dostawców danych obsługujących dobrze finansowane laboratoria. „Wąskim gardłem dla nich wszystkich są dane” – powiedział.