Le monde de l'IA a une nouvelle obsession brillante, et elle se présente sous la forme de trois lettres : RSI. Non, pas de blessure de stress répétitif - bien que l'adoption frénétique de mots à la mode par l'industrie pourrait aussi causer cela. Ce RSI signifie Auto-Amélioration Récursive, le dernier mot à la mode que startups et chercheurs poursuivent, rêvant d'une IA capable de s'améliorer sans l'interférence gênante des humains.
En théorie, le RSI est simple : un système d'IA qui améliore continuellement ses propres capacités, fermant finalement la boucle pour que les humains deviennent optionnels - ou pire, obsolètes. En pratique, comme pour l'AGI avant lui, personne ne peut vraiment s'accorder sur ce que cela signifie réellement ou quand cela pourrait arriver. Mais cela n'a pas arrêté le train du battage médiatique.
Plus tôt ce mois-ci, le célèbre chercheur en IA Richard Socher a lancé une startup appelée Recursive Superintelligence, dont l'objectif principal est de construire « une superintelligence véritablement récursive et auto-améliorante à grande échelle ». Socher a déclaré à TechCrunch que le but est d'automatiser « tout le processus d'idéation, de mise en œuvre et de validation des idées de recherche ». Donc, essentiellement, une IA qui peut inventer ses propres devoirs, les faire et se noter elle-même. Qu'est-ce qui pourrait mal tourner ?
Socher n'est pas seul. Alex Karpathy, un ancien de Tesla et OpenAI maintenant chez Anthropic, travaille sur un projet appelé Auto-Research, utilisant des essaims d'agents pour entraîner des LLM sur des tâches simples. Jusqu'à présent, son travail s'est limité à des améliorations mineures sur un modèle à l'échelle GPT-2 - ce qui, comme Karpathy lui-même l'a noté, n'est « pas une 'recherche' nouvelle et révolutionnaire (encore) ». Mais cela suffit à garder le rêve vivant.
Adaption, fondée par Sara Hooker, ancienne de Cohere et Google, a récemment lancé AutoScientist, un outil visant à automatiser l'entraînement de pointe. Comme le système de Karpathy, il entraîne des agents à faire des améliorations progressives - mais avec la grande ambition d'entraîner un modèle de pointe à grande échelle. Si cela fonctionne, le système pourrait rapidement déraper vers quelque chose de très similaire au RSI.
Doris Xin, fondatrice de Disarray, a pris une route plus pratique : son agent d'apprentissage automatique auto-entraîné a remporté 28 médailles lors d'une récente compétition Kaggle, battant de nombreux agents entraînés par des humains. Xin soutient qu'avec une puissance de calcul et du temps infinis, « nous y sommes déjà ». Elle insiste sur le fait qu'il ne s'agit pas de créativité, mais simplement d'« ingénierie de base ».
Mais il y a des preuves que l'industrie n'est pas aussi proche que le battage médiatique le suggère. Le PDG de Google, Sundar Pichai, a récemment admis : « Nous n'y sommes pas encore tout à fait », décrivant le RSI comme « un niveau d'accélération supplémentaire avec beaucoup d'implications ». Pendant ce temps, l'outil Claude Code d'Anthropic écrirait près de 100 % du code de sa propre équipe. Une enquête récente a révélé que cinq des 18 ingénieurs d'Anthropic pensaient que Mythos pourrait bientôt remplacer un ingénieur L4 - un programmeur de niveau intermédiaire. Cependant, le rapport a noté des faiblesses dans l'auto-direction, notamment « la gestion autonome de tâches ambiguës d'une semaine, la compréhension des priorités de l'organisation, le goût, la vérification, le suivi des instructions et l'épistémique ». En d'autres termes, tout ce qui fait fonctionner le RSI.
Le Center for Security and Emerging Technology de Georgetown a réuni des experts l'année dernière et a constaté une division majeure : certains s'attendaient à une explosion imminente de « superintelligence », d'autres à des progrès plus lents et à un plateau. Helen Toner, directrice du CSET et ancienne membre du conseil d'administration d'OpenAI, a précisé que l'utilisation d'outils d'IA pour la recherche ne qualifie pas de RSI. « Ils utilisent simplement l'IA autant qu'ils le peuvent », a-t-elle déclaré. « Le RSI, c'est vraiment qu'aucun humain n'est nécessaire. »
Ayeja Cotra de METR a présenté des jalons : « adéquation » (l'IA peut faire de la recherche sans humains, même mal), « parité » (l'IA égalise les humains) et « suprématie » (l'IA surpasse la collaboration humain-IA). Elle pense que l'adéquation pourrait arriver d'ici quelques années, mais la parité est plus floue. Une fois la parité atteinte, elle prédit la suprématie dans l'année suivante.
Toner établit un parallèle historique : « Nous sommes passés des langages machine au langage d'assemblage et aux langages compilés ; on s'éloigne des entrailles de l'ordinateur. Mais l'humain est toujours, dans un sens intuitif, aux commandes. » Aller au-delà de ce paradigme nécessite de résoudre