Em fevereiro, este repórter pegou um panfleto em uma marcha anti-IA em Londres. Dizia, em uma homenagem deliberada ou não aos gnomos das cuecas de South Park: "Passo 1: Criar uma supermente digital. Passo 2: ? Passo 3: ?" Produzido pelo Pause AI, um grupo ativista que co-organizou o protesto, o panfleto terminava com um apelo: "Pausem a IA até sabermos que diabos é o Passo 2."

A referência, para os não iniciados, é ao episódio de 1998 de South Park em que Kenny, Kyle, Cartman e Stan descobrem gnomos cujo plano de negócios é "Fase 1: Coletar cuecas. Fase 2: ? Fase 3: Lucro." O meme desde então tem sido usado para satirizar desde estratégias de startups até o plano de financiamento da missão de Marte de Elon Musk. No momento, ele captura perfeitamente o estado da IA: Empresas construíram a tecnologia (Passo 1) e prometeram transformação (Passo 3). Como chegar lá continua sendo um enorme ponto de interrogação.

O Pause AI acredita que o Passo 2 deve envolver regulação, embora exatamente como isso se parece e quem o aplica seja discutível. Os entusiastas da IA, por sua vez, estão convencidos de que o Passo 3 é a salvação e tendem a pular a parte do meio completamente. O cientista-chefe da OpenAI, Jakub Pachocki, descreveu a IA para mim como uma "tecnologia economicamente transformadora", com as terras ensolaradas aparentemente logo além do horizonte. Mas cada um está tomando uma rota diferente, e é impossível saber quem vai conseguir.

Para cada afirmação grandiosa sobre o futuro, há uma verificação de realidade sóbria. Considere dois estudos recentes. Um da Anthropic previu quais empregos os LLMs afetarão mais – gerentes, arquitetos e profissionais de mídia devem se preparar para mudanças; jardineiros, trabalhadores da construção civil e pessoal de hospitalidade, nem tanto. Mas essas previsões são realmente apenas palpites baseados no que os LLMs parecem ser bons, não em como eles realmente se saem no local de trabalho.

Outro estudo de fevereiro por pesquisadores da Mercor, uma startup de contratação de IA, testou vários agentes de IA alimentados por modelos de ponta da OpenAI, Anthropic e Google DeepMind em 480 tarefas de trabalho rotineiramente feitas por banqueiros, consultores e advogados humanos. Cada agente falhou em completar a maioria de suas funções.

Por que tamanha discordância? Para começar, considere quem está fazendo as afirmações e por quê – a Anthropic tem interesse no jogo. A maioria das pessoas nos dizendo que algo grande está prestes a acontecer baseia-se em quão rápido as ferramentas de codificação de IA estão melhorando. Mas nem todas as tarefas podem ser hackeadas com codificação. Outros estudos descobrem que LLMs são ruins em julgamentos estratégicos.

Além disso, as ferramentas não são colocadas em salas limpas. Elas devem funcionar em lugares contaminados com pessoas e fluxos de trabalho existentes, e às vezes adicionar IA piora as coisas. Claro, talvez esses fluxos de trabalho precisem ser rasgados e refeitos em torno da nova tecnologia, mas isso leva tempo e coragem.

Esse grande buraco? Está bem onde o Passo 2 deveria estar. A falta de acordo sobre o que está prestes a acontecer e como cria um vácuo de informação preenchido pela mais recente afirmação absurda da semana, que se dane a evidência. Estamos tão desvinculados de qualquer entendimento real que uma única postagem em rede social pode abalar mercados.

Precisamos de menos palpites e mais evidências. Isso requer transparência dos fabricantes de modelos, coordenação entre pesquisadores e empresas, e novas maneiras de avaliar essa tecnologia no mundo real. A indústria de tecnologia – e com ela a economia mundial – depende da promessa de que a IA será transformadora. Mas isso ainda não é uma aposta certa. Da próxima vez que ouvir afirmações ousadas, lembre-se: a maioria das empresas ainda está tentando descobrir o que fazer com suas cuecas.