KI-Modelle, die mit der physischen Welt interagieren, brauchen Daten darüber, wie sich Dinge bewegen und im Raum existieren, aber anders als Sprachmodelle gibt es keinen bequemen Haufen Internettext zum Durchforsten. Hier kommt Origin Lab ins Spiel, das 8 Millionen Dollar in einer Seed-Finanzierungsrunde unter der Führung von Lightspeed Ventures eingesammelt hat, mit Beteiligung von SV Angel, Eniac, Seven Stars und FPV, sowie Angel-Schecks von Twitch-Mitgründer Kevin Lin und Cruise-Gründer Kyle Vogt.

Der Pitch des Startups ist simpel: Videospielfirmen haben tonnenweise digitale Assets, die bereits für Physik und Bewegung optimiert sind, und KI-Labore wie Yann LeCuns AMI Labs oder Fei-Fei Lis World Labs würden diese Daten gerne kaufen. Origin Lab fungiert als Mittelsmann und wandelt Spiel-Assets in nutzbare Trainingsdaten um – sei es ein einfacher Rendering-Durchlauf oder die Automatisierung von stundenlangem Walkthrough-Material.

„Die KI-Systeme, die jetzt gebaut werden, müssen verstehen, wie die physische Welt funktioniert und wie sich Dinge bewegen“, sagte Co-CEO Anne-Margot Rodde gegenüber TechCrunch. „Diese Daten leben im Wesentlichen in Videospielen.“ Die anderen Mitgründer des Unternehmens sind Antoine Gargot und Colin Carrier.

Die Idee ist nicht neu – Labore haben schon lange ein Auge auf Videospielaufnahmen geworfen, aber Lizenzierungs- und Datenqualitätsprobleme waren Hindernisse. Im Dezember 2024 sorgte OpenAIs Sora-Videomodell für einen kleinen Skandal, weil es offenbar Aufnahmen aus beliebten Spielen und Twitch-Streams ausspuckte, vermutlich weil es damit trainiert worden war. Amazon hat auch offen zugegeben, Twitch-Aufnahmen für das Modelltraining nutzen zu wollen.

Origin‘s 8-Millionen-Dollar-Runde signalisiert einen wachsenden Markt für Datenlieferanten an große KI-Labore. Lightspeed-Partner Faraz Fatemi, der die Investition leitete, merkte an, dass Unternehmen wie Scale AI gezeigt haben, wie stark die Umsätze für Datenanbieter skalieren können, die gut kapitalisierte Labore beliefern. „Der Engpass für alle ist Daten“, sagte er.