Grok échoue dans l'adoption de l'IA gouvernementale, prouvant que même les bureaucrates ont des normes

Il y a une vérité dure à propos du chatbot IA 'en quête de vérité' d'Elon Musk, Grok : il n'est pas très bon, et peu de gens l'utilisent. C'est ce qui ressort d'un nouveau rapport de Reuters, qui a constaté que Grok apparaît à peine dans les registres fédéraux de l'utilisation de l'IA par le gouvernement américain l'année dernière. Ce n'est pas le seul signe que le chatbot phare de xAI est en difficulté, même si Musk le place au cœur de ce qui pourrait être la plus grande introduction en bourse de l'histoire.

Reuters a examiné plus de 400 exemples d'utilisation gouvernementale de l'IA où des fournisseurs spécifiques étaient nommés. Grok ou xAI n'apparaissaient que dans trois cas - chacun pour des usages de base comme la rédaction de documents ou la gestion des réseaux sociaux, et toujours aux côtés de concurrents comme Microsoft et OpenAI. Les modèles d'OpenAI, en comparaison, apparaissaient dans plus de 230 exemples, tandis que Google et Anthropic apparaissaient chacun des dizaines de fois. Un schéma similaire est apparu dans une autre base de données de projets d'IA gouvernementaux plus ambitieux avec un nombre d'utilisateurs plus restreint. Grok n'apparaissait que trois fois : deux fois pour des tâches administratives de routine à la Commission d'assistance électorale, et une fois dans un projet pilote du Département de l'énergie au Lawrence Livermore National Laboratory pour des résumés de documents et des recherches générales. Reuters a trouvé 140 entrées impliquant Microsoft et OpenAI, tandis qu'un bref examen a trouvé au moins 10 entrées pour Anthropic et des dizaines pour Gemini de Google.

Les listes sont une mesure incomplète et inégale de l'adoption gouvernementale. De nombreux autres exemples sont répertoriés sans fournisseur spécifique, et il n'existe pas de définition universelle de ce qui compte comme IA. Les données ne couvrent pas non plus les agences de renseignement ou le Pentagone - où xAI a obtenu un contrat de 200 millions de dollars l'année dernière et a récemment été autorisé à opérer sur des réseaux classifiés après la mise sur liste noire d'Anthropic. Néanmoins, ça ne s'annonce pas bien pour Grok. Il apparaît beaucoup moins que ses rivaux, et quand il apparaît, c'est surtout pour du travail administratif de base - ce qui ne sied guère au modèle de pointe de classe mondiale dont Musk se vante depuis des années.

Les personnes qui ont parlé à Reuters ont suggéré que l'explication était simple : Grok n'est pas aussi bon que ses rivaux. 'Ce n'est tout simplement pas le meilleur modèle qui existe', a déclaré une source anonyme du Pentagone, ajoutant que les employés y préfèrent généralement Gemini ou Claude. Les classements publics des modèles d'IA donnent du poids à cette opinion. Anthropic, Google et OpenAI dominent les premières places, tandis que Grok dépasse rarement le top 10 en dehors de la catégorie occasionnelle d'image ou de vidéo. C'est gênant pour Musk, et encore plus gênant pour SpaceX, qui a absorbé xAI plus tôt cette année. Le dossier d'introduction en bourse de l'entreprise de fusées montre que la société a placé l'IA - et Grok en particulier - au cœur de son argumentaire auprès des investisseurs. SpaceX prétend avoir identifié 'le plus grand marché adressable total exploitable de l'histoire humaine' : une opportunité stupéfiante de 28 500 milliards de dollars, même si, malheureusement, elle n'offre aucun calendrier pour y parvenir. Pratiquement toute cette valeur estimée provient de l'IA, en particulier de l'IA d'entreprise, et non des fusées ou des satellites.

Reuters note que les performances de Grok dans les agences gouvernementales pourraient indiquer comment il se comporte dans d'autres lieux de travail également. Dans le cadre de la poussée de xAI pour les clients d'entreprise, Musk aurait fait pression sur les banques pour qu'elles achètent des abonnements Grok si elles souhaitent participer à l'introduction en bourse de SpaceX - mais si elles n'en ont pas pour leur argent, ces accords pourraient s'avérer être une solution à court terme. Comme si ses performances lamentables n'étaient pas assez gênantes, Musk a récemment admis que xAI a utilisé les modèles d'OpenAI pour aider à former et améliorer Grok. Le processus, connu sous le nom de distillation, est standard lorsque les entreprises utilisent leurs propres modèles, mais bien plus controversé lorsqu'il implique l'utilisation du système d'un rival. Grok ne peut même pas battre les modèles sur lesquels il s'entraîne.

Dans sa version grand public, Grok est délibérément désagréable. Musk a présenté le chatbot comme une alternative moins biaisée et moins censurée à des outils comme ChatGPT, mais cela s'est traduit par un produit aux normes de preuve laxistes, une obsession malsaine pour Musk, et un long historique de résultats offensants, conspirationnistes et sexualisés. Même

Grok échoue dans l'adoption de l'IA gouvernementale, prouvant que même les bureaucrates ont des normes

Les nouvelles dans votre boîte.