Мир ИИ обзавёлся новым блестящим увлечением, и оно имеет форму трёх букв: RSI. Нет, не повторяющееся растяжение сухожилий — хотя лихорадочное принятие отраслевых модных словечек может вызвать и это. Этот RSI означает Recursive Self-Improvement (рекурсивное самоулучшение) — последнее модное слово, за которым стартапы и исследователи гонятся за видением ИИ, способного улучшать себя без назойливого человеческого вмешательства.
В теории RSI прост: система ИИ, которая непрерывно улучшает свои собственные возможности, в конечном итоге замыкая цикл так, что люди становятся необязательными — или, что хуже, устаревшими. На практике, как и с AGI до этого, никто не может прийти к согласию относительно того, что это на самом деле означает или когда это может наступить. Но это не остановило поезд хайпа.
Ранее в этом месяце известный исследователь ИИ Ричард Сочер запустил стартап под названием Recursive Superintelligence, основная цель которого — построить «по-настоящему рекурсивный, самоулучшающийся сверхразум в масштабе». Сочер рассказал TechCrunch, что цель — автоматизировать «весь процесс выдвижения идей, реализации и проверки исследовательских идей». То есть, по сути, ИИ, который может придумывать себе домашнее задание, делать его и оценивать себя. Что может пойти не так?
Сочер не одинок. Алекс Карпати, выпускник Tesla и OpenAI, ныне работающий в Anthropic, работал над проектом под названием Auto-Research, используя рои агентов для обучения LLM на простых задачах. Пока его работа ограничивалась незначительными улучшениями модели масштаба GPT-2 — что, как отметил сам Карпати, «пока не является новым, прорывным «исследованием»». Но этого достаточно, чтобы поддерживать мечту.
Adaption, основанная Сарой Хукер, выпускницей Cohere и Google, недавно запустила AutoScientist — инструмент, направленный на автоматизацию обучения на переднем крае. Как и система Карпати, она обучает агентов вносить постепенные улучшения — но с грандиозной амбицией обучить полноценную модель переднего края. Если это сработает, система может быстро перерасти во что-то очень похожее на RSI.
Основатель Disarray Дорис Синь выбрала более практичный путь: её самообучающийся агент машинного обучения завоевал 28 медалей в недавнем соревновании Kaggle, победив многих агентов, обученных людьми. Синь утверждает, что при бесконечных вычислениях и времени «мы уже там». Она настаивает, что дело не в креативности, а просто в «инженерной рутине».
Но есть свидетельства того, что индустрия не так близка, как предполагает хайп. Генеральный директор Google Сундар Пичаи недавно признал: «Мы ещё не совсем там», описав RSI как «следующий уровень ускорения с множеством последствий». Тем временем, инструмент Claude Code от Anthropic, как сообщается, пишет почти 100% кода своей собственной команды. Недавний опрос показал, что пятеро из 18 инженеров Anthropic считали, что Mythos вскоре сможет заменить инженера L4 — программиста среднего уровня. Однако в отчёте отмечались слабости в самонаправлении, включая «самостоятельное управление неоднозначными задачами на неделю, понимание приоритетов организации, вкус, верификацию, следование инструкциям и эпистемику». Другими словами, всё, что делает RSI работоспособным.
Центр безопасности и новых технологий Джорджтаунского университета в прошлом году собрал экспертов и обнаружил серьёзный раскол: одни ожидали неизбежного взрыва «сверхразума», другие — более медленного прогресса и плато. Хелен Тонер, директор CSET и бывший член совета директоров OpenAI, пояснила, что использование инструментов ИИ для исследований не qualifies как RSI. «Они просто используют ИИ по максимуму», — сказала она. «RSI — это когда люди не нужны».
Айеша Котра из METR обозначила вехи: «адекватность» (ИИ может исследовать без людей, даже если плохо), «паритет» (ИИ сравнивается с людьми) и «превосходство» (ИИ превосходит коллаборацию человека и ИИ). Она считает, что адекватность может наступить в течение пары лет, но паритет более туманен. Как только паритет будет достигнут, она прогнозирует превосходство в течение ещё одного года.
Тонер проводит историческую параллель: «Мы перешли от машинных языков к ассемблеру и компилируемым языкам; вы отдаляетесь от внутренностей компьютера. Но человек всё ещё, в некотором интуитивном смысле, управляет шоу». Выход за пределы этой парадигмы требует решения