O mundo da IA tem uma nova obsessão brilhante, e ela vem na forma de três letras: RSI. Não, não é lesão por esforço repetitivo - embora a adoção frenética de jargões pela indústria também possa causar isso. Este RSI significa Autoaperfeiçoamento Recursivo, a mais recente buzzword que faz startups e pesquisadores correrem atrás de uma visão de IA que pode se atualizar sem a irritante interferência humana.
Na teoria, RSI é simples: um sistema de IA que melhora continuamente suas próprias capacidades, eventualmente fechando o ciclo para que os humanos se tornem opcionais - ou pior, obsoletos. Na prática, como aconteceu com a AGI antes, ninguém consegue concordar sobre o que realmente significa ou quando pode chegar. Mas isso não impediu o trem do hype.
No início deste mês, o renomado pesquisador de IA Richard Socher lançou uma startup chamada Recursive Superintelligence, cujo foco principal é construir “superinteligência verdadeiramente recursiva e autoaperfeiçoável em escala”. Socher disse ao TechCrunch que o objetivo é automatizar “todo o processo de ideação, implementação e validação de ideias de pesquisa”. Então, basicamente, uma IA que pode criar seu próprio dever de casa, fazê-lo e se autoavaliar. O que poderia dar errado?
Socher não está sozinho. Alex Karpathy, ex-Tesla e OpenAI agora na Anthropic, tem trabalhado em um projeto chamado Auto-Research, usando enxames de agentes para treinar LLMs em tarefas simples. Até agora, seu trabalho se limitou a melhorias menores em um modelo de escala GPT-2 - o que, como o próprio Karpathy observou, “não é pesquisa ‘inovadora’ ou inovadora (ainda)”. Mas é o suficiente para manter o sonho vivo.
A Adaption, fundada pela ex-Cohere e Google Sara Hooker, lançou recentemente o AutoScientist, uma ferramenta destinada a automatizar o treinamento de fronteira. Como o sistema de Karpathy, ele treina agentes para fazer melhorias incrementais - mas com a grande ambição de treinar um modelo de fronteira em escala total. Se funcionar, o sistema pode rapidamente espiralar para algo muito parecido com RSI.
A fundadora da Disarray, Doris Xin, adotou uma abordagem mais prática: seu agente de aprendizado de máquina autotreinado ganhou 28 medalhas em uma competição recente do Kaggle, derrotando muitos agentes treinados por humanos. Xin argumenta que com computação e tempo infinitos, “já estamos lá”. Ela insiste que não se trata de criatividade, apenas “engenharia básica”.
Mas há evidências de que a indústria não está tão perto quanto o hype sugere. O CEO do Google, Sundar Pichai, admitiu recentemente: “Ainda não chegamos lá”, descrevendo RSI como “um próximo nível de aceleração com muitas implicações”. Enquanto isso, a ferramenta Claude Code da Anthropic está supostamente escrevendo quase 100% do código de sua própria equipe. Uma pesquisa recente descobriu que cinco dos 18 engenheiros da Anthropic acreditavam que o Mythos poderia em breve substituir um engenheiro L4 - um programador de nível médio. No entanto, o relatório observou fraquezas na autodireção, incluindo “gerenciamento autônomo de tarefas ambíguas de uma semana, compreensão de prioridades organizacionais, gosto, verificação, seguimento de instruções e epistemologia”. Em outras palavras, tudo o que faz o RSI realmente funcionar.
O Centro de Segurança e Tecnologia Emergente de Georgetown reuniu especialistas no ano passado e encontrou uma grande divisão: alguns esperavam uma explosão iminente de “superinteligência”, outros um progresso mais lento e um platô. Helen Toner, diretora do CSET e ex-membro do conselho da OpenAI, esclareceu que usar ferramentas de IA para pesquisa não se qualifica como RSI. “Eles estão apenas usando IA o máximo que podem”, disse ela. “RSI é realmente que não há humanos necessários.”
Ayeja Cotra, da METR, estabeleceu marcos: “adequação” (IA pode pesquisar sem humanos, mesmo que mal), “paridade” (IA iguala humanos) e “supremacia” (IA supera a colaboração humano-IA). Ela acha que a adequação pode chegar em alguns anos, mas a paridade é mais nebulosa. Uma vez que a paridade seja alcançada, ela prevê supremacia dentro de mais um ano.
Toner traça um paralelo histórico: “Passamos de linguagens de máquina para linguagem assembly e linguagens compiladas; você está se afastando das entranhas do computador. Mas o humano ainda está, em algum sentido intuitivo, no comando.” Ir além desse paradigma requer resolver