AI मॉडल जो भौतिक दुनिया से इंटरैक्ट करते हैं, उन्हें डेटा चाहिए कि चीज़ें कैसे चलती हैं और अंतरिक्ष में मौजूद हैं, लेकिन भाषा मॉडल के विपरीत, इंटरनेट टेक्स्ट का कोई सुविधाजनक ढेर नहीं है जिसे खुरचा जा सके। तो आता है ओरिजिन लैब, जिसने लाइटस्पीड वेंचर्स के नेतृत्व में 8 मिलियन डॉलर की सीड फंडिंग जुटाई है, जिसमें SV एंजल, एनियाक, सेवन स्टार्स और FPV ने भाग लिया, साथ ही ट्विच के सह-संस्थापक केविन लिन और क्रूज़ के संस्थापक काइल वोग्ट से एंजल चेक भी शामिल हैं।
स्टार्टअप का पिच सीधा है: वीडियो गेम कंपनियों के पास पहले से ही फिजिक्स और मूवमेंट के लिए ऑप्टिमाइज़ किए गए ढेरों डिजिटल एसेट्स हैं, और यान लेक्यून की AMI लैब्स या फी-फी ली की वर्ल्ड लैब्स जैसी AI लैब्स वह डेटा खरीदना पसंद करेंगी। ओरिजिन लैब बिचौलिए का काम करता है, गेम एसेट्स को उपयोगी ट्रेनिंग डेटा में बदलता है - चाहे वह एक साधारण रेंडरिंग रन हो या घंटों के वॉकथ्रू फुटेज को ऑटोमेट करना।
"अब जो AI सिस्टम बनाए जा रहे हैं, उन्हें यह समझने की ज़रूरत है कि भौतिक दुनिया कैसे काम करती है और चीज़ें कैसे चलती हैं," सह-सीईऐ ऐनी-मार्गोट रोडे ने टेकक्रंच को बताया। "वह डेटा मूल रूप से वीडियो गेम में रहता है।" कंपनी के अन्य सह-संस्थापक एंटोनी गार्गोट और कॉलिन कैरियर हैं।
यह विचार नया नहीं है - लैब्स लंबे समय से वीडियो गेम फुटेज पर नज़र गड़ाए हुए हैं, लेकिन लाइसेंसिंग और डेटा-गुणवत्ता के मुद्दे बाधा रहे हैं। दिसंबर 2024 में, OpenAI के Sora वीडियो मॉडल ने एक छोटा सा घोटाला खड़ा कर दिया था जब उसने कथित तौर पर लोकप्रिय गेम्स और ट्विच स्ट्रीम के फुटेज को दोहराया, संभवतः क्योंकि उसे उस पर प्रशिक्षित किया गया था। अमेज़न ने भी मॉडल ट्रेनिंग के लिए ट्विच फुटेज का उपयोग करने की इच्छा जाहिर की है।
ओरिजिन का 8 मिलियन डॉलर का फंडिंग राउंड बड़ी AI लैब्स को डेटा आपूर्तिकर्ताओं के बढ़ते बाजार का संकेत है। लाइटस्पीड पार्टनर फ़राज़ फ़ातेमी, जिन्होंने निवेश का नेतृत्व किया, ने कहा कि स्केल AI जैसी कंपनियों ने दिखाया है कि अच्छी तरह से पूंजीकृत लैब्स की सेवा करने वाले डेटा विक्रेताओं के लिए राजस्व कितनी तेजी से बढ़ सकता है। "उन सभी के लिए अड़चन डेटा है," उन्होंने कहा।