В феврале этот репортёр подобрал листовку на анти-ИИ марше в Лондоне. На ней было написано, возможно, в намеренную дань уважения гномам-трусам из «Южного парка»: «Шаг 1: Вырастить цифровой суперинтеллект. Шаг 2: ? Шаг 3: ?». Созданная Pause AI, активистской группой, которая совместно организовала протест, листовка заканчивалась призывом: «Приостановите ИИ, пока мы не поймём, что, чёрт возьми, такое Шаг 2».

Отсылка, для непосвящённых, к эпизоду «Южного парка» 1998 года, в котором Кенни, Кайл, Картман и Стэн обнаруживают гномов, чей бизнес-план: «Фаза 1: Собирать трусы. Фаза 2: ? Фаза 3: Прибыль». С тех пор мем используется для сатиры на всё, от стратегий стартапов до плана финансирования миссии Илона Маска на Марс. Прямо сейчас он идеально описывает состояние ИИ: компании построили технологию (Шаг 1) и пообещали трансформацию (Шаг 3). Как они туда доберутся, остаётся огромным вопросительным знаком.

Pause AI считает, что Шаг 2 должен включать регулирование, хотя то, как именно оно выглядит и кто его обеспечивает, остаётся предметом споров. Сторонники ИИ, тем временем, убеждены, что Шаг 3 — это спасение, и склонны полностью пропускать середину. Главный учёный OpenAI Якуб Пахоцки описал мне ИИ как «экономически преобразующую технологию», причём солнечные высоты, видимо, уже на горизонте. Но все идут разными путями, и никто не знает, кто доберётся.

За каждым громким заявлением о будущем следует отрезвляющая проверка реальности. Рассмотрим два недавних исследования. Одно от Anthropic предсказало, на какие профессии LLM повлияют больше всего — менеджерам, архитекторам и работникам медиа стоит готовиться к переменам; садовникам, строителям и работникам гостиничного бизнеса — не особо. Но эти прогнозы на самом деле просто догадки, основанные на том, в чём LLM кажутся хороши, а не на том, как они на самом деле работают на рабочем месте.

Другое исследование, проведённое в феврале исследователями из Mercor, стартапа по найму в сфере ИИ, протестировало несколько ИИ-агентов на базе топовых моделей от OpenAI, Anthropic и Google DeepMind на 480 рабочих задачах, которые обычно выполняют люди-банкиры, консультанты и юристы. Каждый агент не смог выполнить большую часть своих обязанностей.

Почему такое расхождение во мнениях? Для начала, обратите внимание, кто делает заявления и почему — у Anthropic есть своя игра. Большинство тех, кто говорит нам, что вот-вот произойдёт что-то большое, основываются на том, как быстро совершенствуются инструменты ИИ для кодирования. Но не все задачи можно взломать с помощью кодирования. Другие исследования показывают, что LLM плохо справляются со стратегическими суждениями.

Более того, инструменты не помещают в чистые комнаты. Они должны работать в местах, загрязнённых людьми и существующими рабочими процессами, и иногда добавление ИИ делает всё хуже. Конечно, возможно, эти рабочие процессы нужно пересмотреть и перестроить вокруг новой технологии, но это требует времени и смелости.

Эта большая дыра? Она как раз там, где должен быть Шаг 2. Отсутствие согласия относительно того, что вот-вот произойдёт и как, создаёт информационный вакуум, который заполняется последним диким заявлением недели, плевать на доказательства. Мы настолько оторваны от реального понимания, что один пост в соцсетях может потрясти рынки.

Нам нужно меньше догадок и больше доказательств. Это требует прозрачности от создателей моделей, координации между исследователями и бизнесом, а также новых способов оценки этой технологии в реальном мире. Технологическая индустрия — а вместе с ней и мировая экономика — держится на обещании, что ИИ будет преобразующим. Но это пока не гарантированная ставка. В следующий раз, когда услышите смелые заявления, помните: большинство компаний всё ещё пытаются понять, что делать со своими трусами.