تحتاج نماذج الذكاء الاصطناعي التي تتفاعل مع العالم المادي إلى بيانات حول كيفية تحرك الأشياء ووجودها في الفضاء، لكن على عكس نماذج اللغة، لا توجد كومة مريحة من نصوص الإنترنت لاستخراجها. هنا تظهر شركة أوريجين لاب، التي جمعت 8 ملايين دولار في تمويل أولي بقيادة لايتسبيد فينتشرز، بمشاركة إس في آنجل، إينياك، سفن ستارز، وإف بي في، بالإضافة إلى شيكات ملائكية من المؤسس المشارك لتويتش كيفين لين ومؤسس كروز كايل فوجت.
فكرة الشركة الناشئة واضحة: شركات ألعاب الفيديو لديها أطنان من الأصول الرقمية المحسّنة بالفعل للفيزياء والحركة، ومختبرات الذكاء الاصطناعي مثل مختبرات يان ليكون إيه إم آي أو مختبرات فاي-فاي لي وورلد لاب سترغب في شراء تلك البيانات. تعمل أوريجين لاب كوسيط، محوّلة أصول الألعاب إلى بيانات تدريب قابلة للاستخدام - سواء كان ذلك تشغيل عرض بسيط أو أتمتة ساعات من لقطات التجوال.
"الأنظمة الذكاء الاصطناعي التي تُبنى الآن تحتاج إلى فهم كيف يعمل العالم المادي وكيف تتحرك الأشياء،" قالت الرئيسة التنفيذية المشاركة آن-مارجو رود لـ تك كرانش. "تلك البيانات تعيش أساسًا في ألعاب الفيديو." المؤسسان المشاركان الآخران للشركة هما أنطوان جارغو وكولين كاريير.
الفكرة ليست جديدة - لطالما كانت المختبرات تتطلع إلى لقطات ألعاب الفيديو، لكن مشكلات الترخيص وجودة البيانات كانت عقبات. في ديسمبر 2024، تسبب نموذج سورا للفيديو من أوبن إيه آي في فضيحة صغيرة بإعادة إنتاج لقطات من ألعاب شهيرة وبث تويتش، على الأرجح لأنه دُرّب عليها. كما كانت أمازون صريحة بشأن رغبتها في استخدام لقطات تويتش لتدريب النماذج.
جولة أوريجين البالغة 8 ملايين دولار تشير إلى سوق متنامية لموردي البيانات لمختبرات الذكاء الاصطناعي الكبرى. لاحظ الشريك في لايتسبيد فراز فاتيمي، الذي قاد الاستثمار، أن شركات مثل سكيل إيه آي أظهرت كيف يمكن للإيرادات أن تتوسع بشكل حاد لموردي البيانات الذين يخدمون مختبرات ممولة جيدًا. "العقبة أمامهم جميعًا هي البيانات،" قال.