AI-modellen die met de fysieke wereld interacteren, hebben data nodig over hoe dingen bewegen en in de ruimte bestaan, maar in tegenstelling tot taalmodellen is er geen handige stapel internettekst om te schrapen. Enter Origin Lab, dat $8 miljoen aan seed-financiering heeft opgehaald onder leiding van Lightspeed Ventures, met deelname van SV Angel, Eniac, Seven Stars en FPV, plus angel-cheques van Twitch-medeoprichter Kevin Lin en Cruise-oprichter Kyle Vogt.
De pitch van de startup is simpel: videogamebedrijven hebben tonnen digitale assets die al geoptimaliseerd zijn voor fysica en beweging, en AI-labs zoals Yann LeCun's AMI Labs of Fei-Fei Li's World Labs zouden die data graag kopen. Origin Lab fungeert als tussenpersoon en zet game-assets om in bruikbare trainingsdata - of het nu een simpele rendering-run is of het automatiseren van uren aan walkthrough-beelden.
"De AI-systemen die nu worden gebouwd, moeten begrijpen hoe de fysieke wereld werkt en hoe dingen bewegen," vertelde mede-CEO Anne-Margot Rodde aan TechCrunch. "Die data leeft in wezen in videogames." De andere medeoprichters van het bedrijf zijn Antoine Gargot en Colin Carrier.
Het idee is niet nieuw - labs hebben al lang een oogje op videogamebeelden, maar licentie- en datakwaliteitsproblemen waren obstakels. In december 2024 veroorzaakte OpenAI's Sora-videomodel een klein schandaal door blijkbaar beelden uit populaire games en Twitch-streams te regurgiteren, vermoedelijk omdat het erop was getraind. Amazon heeft ook openlijk aangegeven Twitch-beelden te willen gebruiken voor modeltraining.
De $8 miljoen ophaling van Origin signaleert een groeiende markt voor dataleveranciers aan grote AI-labs. Lightspeed-partner Faraz Fatemi, die de investering leidde, merkte op dat bedrijven zoals Scale AI hebben laten zien hoe scherp de omzet kan opschalen voor dataverkopers die goed gekapitaliseerde labs bedienen. "De bottleneck voor hen allemaal is data," zei hij.