En février, ce journaliste a ramassé un prospectus lors d'une marche anti-IA à Londres. On pouvait y lire, dans ce qui était ou n'était pas un hommage délibéré aux gnomes des sous-vêtements de South Park : « Étape 1 : Développer un super-esprit numérique. Étape 2 : ? Étape 3 : ? » Produit par Pause AI, un groupe d'activistes co-organisateur de la manifestation, le prospectus se terminait par un appel : « Mettez l'IA en pause jusqu'à ce qu'on sache ce qu'est cette fichue étape 2. »
Pour les non-initiés, il s'agit d'une référence à l'épisode de South Park de 1998 dans lequel Kenny, Kyle, Cartman et Stan découvrent des gnomes dont le plan d'affaires est « Phase 1 : Collecter des sous-vêtements. Phase 2 : ? Phase 3 : Bénéfices. » Ce mème est depuis utilisé pour satiriser tout, des stratégies de start-up au plan de financement de la mission martienne d'Elon Musk. Aujourd'hui, il capture parfaitement l'état de l'IA : les entreprises ont construit la technologie (étape 1) et promis la transformation (étape 3). Comment y arriver reste un énorme point d'interrogation.
Pause AI croit que l'étape 2 doit impliquer une régulation, bien que ce à quoi elle ressemble exactement et qui l'applique soit sujet à débat. Les promoteurs de l'IA, quant à eux, sont convaincus que l'étape 3 est le salut et ont tendance à sauter complètement la partie du milieu. Jakub Pachocki, scientifique en chef d'OpenAI, m'a décrit l'IA comme une « technologie économiquement transformatrice », avec les hautes terres ensoleillées apparemment juste au-dessus de l'horizon. Mais chacun emprunte un chemin différent, et personne ne sait qui y parviendra.
Pour chaque grande affirmation sur l'avenir, il y a une vérification de réalité qui fait réfléchir. Considérez deux études récentes. L'une d'Anthropic a prédit quels emplois les LLM affecteront le plus – les managers, architectes et professionnels des médias devraient se préparer au changement ; les jardiniers, ouvriers du bâtiment et personnel hôtelier, pas tellement. Mais ces prédictions ne sont en réalité que des suppositions basées sur ce dans quoi les LLM semblent bons, pas sur leur performance réelle en milieu de travail.
Une autre étude de février par des chercheurs de Mercor, une start-up de recrutement en IA, a testé plusieurs agents IA alimentés par des modèles de premier ordre d'OpenAI, Anthropic et Google DeepMind sur 480 tâches professionnelles effectuées régulièrement par des banquiers, consultants et avocats humains. Chaque agent a échoué à accomplir la plupart de ses tâches.
Pourquoi un tel désaccord ? Pour commencer, considérez qui fait les affirmations et pourquoi – Anthropic a des intérêts dans le jeu. La plupart des gens qui nous disent que quelque chose de grand est sur le point de se produire se basent sur la rapidité avec laquelle les outils de codage en IA s'améliorent. Mais toutes les tâches ne peuvent pas être résolues par le codage. D'autres études montrent que les LLM sont mauvais pour les jugements stratégiques.
De plus, les outils ne sont pas déployés dans des salles blanches. Ils doivent fonctionner dans des endroits contaminés par les humains et les flux de travail existants, et parfois l'ajout d'IA aggrave les choses. Certes, peut-être que ces flux de travail doivent être déchirés et remodelés autour de la nouvelle technologie, mais cela prend du temps et du cran.
Ce grand trou ? Il se trouve exactement là où devrait être l'étape 2. Le manque d'accord sur ce qui va se passer et comment crée un vide d'information comblé par la dernière affirmation farfelue de la semaine, preuves ou non. Nous sommes si déconnectés de toute compréhension réelle qu'un seul post sur les réseaux sociaux peut ébranler les marchés.
Nous avons besoin de moins de suppositions et de plus de preuves. Cela nécessite de la transparence de la part des fabricants de modèles, de la coordination entre chercheurs et entreprises, et de nouvelles façons d'évaluer cette technologie dans le monde réel. L'industrie technologique – et avec elle l'économie mondiale – repose sur la promesse que l'IA sera transformatrice. Mais ce n'est pas encore un pari sûr. La prochaine fois que vous entendrez des affirmations audacieuses, souvenez-vous : la plupart des entreprises cherchent encore quoi faire avec leurs sous-vêtements.