Indústria de IA Descobre Novo Acrônimo de Três Letras para se Preocupar, Ainda Vaga em Detalhes

O mundo da IA tem uma nova obsessão brilhante, e ela vem na forma de três letras: RSI. Não, não é lesão por esforço repetitivo - embora a adoção frenética de jargões pela indústria também possa causar isso. Este RSI significa Autoaperfeiçoamento Recursivo, a mais recente buzzword que faz startups e pesquisadores correrem atrás de uma visão de IA que pode se atualizar sem a irritante interferência humana.

Na teoria, RSI é simples: um sistema de IA que melhora continuamente suas próprias capacidades, eventualmente fechando o ciclo para que os humanos se tornem opcionais - ou pior, obsoletos. Na prática, como aconteceu com a AGI antes, ninguém consegue concordar sobre o que realmente significa ou quando pode chegar. Mas isso não impediu o trem do hype.

No início deste mês, o renomado pesquisador de IA Richard Socher lançou uma startup chamada Recursive Superintelligence, cujo foco principal é construir “superinteligência verdadeiramente recursiva e autoaperfeiçoável em escala”. Socher disse ao TechCrunch que o objetivo é automatizar “todo o processo de ideação, implementação e validação de ideias de pesquisa”. Então, basicamente, uma IA que pode criar seu próprio dever de casa, fazê-lo e se autoavaliar. O que poderia dar errado?

Socher não está sozinho. Alex Karpathy, ex-Tesla e OpenAI agora na Anthropic, tem trabalhado em um projeto chamado Auto-Research, usando enxames de agentes para treinar LLMs em tarefas simples. Até agora, seu trabalho se limitou a melhorias menores em um modelo de escala GPT-2 - o que, como o próprio Karpathy observou, “não é pesquisa ‘inovadora’ ou inovadora (ainda)”. Mas é o suficiente para manter o sonho vivo.

A Adaption, fundada pela ex-Cohere e Google Sara Hooker, lançou recentemente o AutoScientist, uma ferramenta destinada a automatizar o treinamento de fronteira. Como o sistema de Karpathy, ele treina agentes para fazer melhorias incrementais - mas com a grande ambição de treinar um modelo de fronteira em escala total. Se funcionar, o sistema pode rapidamente espiralar para algo muito parecido com RSI.

A fundadora da Disarray, Doris Xin, adotou uma abordagem mais prática: seu agente de aprendizado de máquina autotreinado ganhou 28 medalhas em uma competição recente do Kaggle, derrotando muitos agentes treinados por humanos. Xin argumenta que com computação e tempo infinitos, “já estamos lá”. Ela insiste que não se trata de criatividade, apenas “engenharia básica”.

Mas há evidências de que a indústria não está tão perto quanto o hype sugere. O CEO do Google, Sundar Pichai, admitiu recentemente: “Ainda não chegamos lá”, descrevendo RSI como “um próximo nível de aceleração com muitas implicações”. Enquanto isso, a ferramenta Claude Code da Anthropic está supostamente escrevendo quase 100% do código de sua própria equipe. Uma pesquisa recente descobriu que cinco dos 18 engenheiros da Anthropic acreditavam que o Mythos poderia em breve substituir um engenheiro L4 - um programador de nível médio. No entanto, o relatório observou fraquezas na autodireção, incluindo “gerenciamento autônomo de tarefas ambíguas de uma semana, compreensão de prioridades organizacionais, gosto, verificação, seguimento de instruções e epistemologia”. Em outras palavras, tudo o que faz o RSI realmente funcionar.

O Centro de Segurança e Tecnologia Emergente de Georgetown reuniu especialistas no ano passado e encontrou uma grande divisão: alguns esperavam uma explosão iminente de “superinteligência”, outros um progresso mais lento e um platô. Helen Toner, diretora do CSET e ex-membro do conselho da OpenAI, esclareceu que usar ferramentas de IA para pesquisa não se qualifica como RSI. “Eles estão apenas usando IA o máximo que podem”, disse ela. “RSI é realmente que não há humanos necessários.”

Ayeja Cotra, da METR, estabeleceu marcos: “adequação” (IA pode pesquisar sem humanos, mesmo que mal), “paridade” (IA iguala humanos) e “supremacia” (IA supera a colaboração humano-IA). Ela acha que a adequação pode chegar em alguns anos, mas a paridade é mais nebulosa. Uma vez que a paridade seja alcançada, ela prevê supremacia dentro de mais um ano.

Toner traça um paralelo histórico: “Passamos de linguagens de máquina para linguagem assembly e linguagens compiladas; você está se afastando das entranhas do computador. Mas o humano ainda está, em algum sentido intuitivo, no comando.” Ir além desse paradigma requer resolver

Indústria de IA Descobre Novo Acrônimo de Três Letras para se Preocupar, Ainda Vaga em Detalhes

Notícias na sua caixa.