AI-моделям, взаимодействующим с физическим миром, нужны данные о том, как объекты движутся и существуют в пространстве, но, в отличие от языковых моделей, у них нет удобной кучи интернет-текстов для сбора. Встречайте Origin Lab, которая привлекла $8 млн посевных инвестиций под руководством Lightspeed Ventures, при участии SV Angel, Eniac, Seven Stars и FPV, а также ангельские чеки от сооснователя Twitch Кевина Лина и основателя Cruise Кайла Фогта.

Предложение стартапа прямолинейно: у компаний-разработчиков видеоигр есть тонны цифровых активов, уже оптимизированных для физики и движения, и AI-лаборатории вроде AMI Labs Янна Лекуна или World Labs Фэй-Фэй Ли с радостью купят эти данные. Origin Lab выступает посредником, преобразуя игровые активы в пригодные для обучения данные — будь то простой рендеринг или автоматизация часов прохождения.

«Создаваемые сейчас AI-системы должны понимать, как работает физический мир и как движутся объекты», — рассказала TechCrunch со-генеральный директор Анн-Марго Родд. «Эти данные по сути живут в видеоиграх». Другие сооснователи компании — Антуан Гарго и Колин Карриер.

Идея не нова — лаборатории давно заглядывались на кадры из видеоигр, но проблемы с лицензированием и качеством данных были препятствиями. В декабре 2024 года видеомодель OpenAI Sora вызвала небольшой скандал, очевидно, воспроизводя кадры из популярных игр и стримов на Twitch, предположительно потому, что была обучена на них. Amazon также открыто заявлял о желании использовать кадры с Twitch для обучения моделей.

Привлечение $8 млн Origin сигнализирует о растущем рынке поставщиков данных для крупных AI-лабораторий. Партнёр Lightspeed Фараза Фатеми, возглавивший инвестиции, отметил, что такие компании, как Scale AI, показали, насколько резко может масштабироваться выручка для поставщиков данных, обслуживающих хорошо финансируемые лаборатории. «Узким местом для всех них являются данные», — сказал он.