Grok Fracasa en la Adopción de IA Gubernamental, Demostrando que Incluso los Burócratas Tienen Estándares

Hay una verdad dura sobre el chatbot de IA 'buscador de la verdad' de Elon Musk, Grok: No es muy bueno, y no mucha gente lo usa. Esa es la conclusión de un nuevo informe de Reuters, que encontró que Grok apenas aparece en los registros federales de cómo el gobierno de EE. UU. usó la IA el año pasado. No es la única señal de que el chatbot insignia de xAI está en problemas, incluso mientras Musk lo pone en el centro de lo que podría ser la OPI más grande de la historia.

Reuters revisó más de 400 ejemplos de uso gubernamental de IA donde se nombraban proveedores específicos. Grok o xAI aparecieron solo en tres, cada uno para usos básicos como redacción de documentos o gestión de redes sociales, y siempre junto a competidores como Microsoft y OpenAI. Los modelos de OpenAI, en comparación, aparecieron en más de 230 ejemplos, mientras que Google y Anthropic aparecieron docenas de veces cada uno. Un patrón similar apareció en otra base de datos de proyectos gubernamentales de IA más ambiciosos con números más pequeños de usuarios. Grok apareció solo tres veces: dos para tareas administrativas rutinarias en la Comisión de Asistencia Electoral, y una en un piloto del Departamento de Energía en el Laboratorio Nacional Lawrence Livermore para resúmenes de documentos e investigación general. Reuters encontró 140 entradas que involucraban a Microsoft y OpenAI, mientras que una breve revisión encontró al menos 10 entradas para Anthropic y docenas para Gemini de Google.

Las listas son una medida incompleta y desigual de la adopción gubernamental. Muchos más ejemplos se enumeran sin un proveedor específico, y no hay una definición universal de lo que cuenta como IA. Los datos tampoco capturan agencias de inteligencia o el Pentágono, donde xAI aseguró un contrato de $200 millones el año pasado y recientemente fue autorizado para operar en redes clasificadas después de la inclusión en lista negra de Anthropic. Aun así, no pinta bien para Grok. Aparece mucho menos que sus rivales, y cuando aparece, es principalmente para trabajo administrativo básico, difícilmente digno del modelo fronterizo de clase mundial del que Musk se ha jactado durante años.

Personas que hablaron con Reuters sugirieron que la explicación era simple: Grok no es tan bueno como sus rivales. 'Simplemente no es el mejor modelo disponible', dijo una fuente anónima del Pentágono, añadiendo que el personal allí tiende a preferir Gemini o Claude. Los rankings públicos de modelos de IA respaldan esa opinión. Anthropic, Google y OpenAI dominan los primeros puestos, mientras que Grok rara vez entra en el top 10 fuera de la categoría ocasional de imagen o video. Eso es incómodo para Musk, y aún más incómodo para SpaceX, que absorbió xAI a principios de este año. La presentación de la OPI de la empresa de cohetes muestra que la compañía ha puesto la IA, y específicamente Grok, en el centro de su propuesta a los inversores. SpaceX afirma haber identificado 'el mercado total direccionable más grande de la historia humana': una asombrosa oportunidad de $28.5 billones, aunque, lamentablemente, no ofrece un cronograma para llegar allí. Prácticamente todo este valor estimado proviene de la IA, la IA empresarial en particular, no de cohetes o satélites.

Reuters señala que el rendimiento de Grok en agencias gubernamentales podría insinuar cómo le va en otros lugares de trabajo también. Como parte del impulso de xAI para clientes empresariales, Musk supuestamente ha presionado a los bancos para que compren suscripciones a Grok si desean participar en la OPI de SpaceX, pero si no están obteniendo el valor de su dinero, estos acuerdos podrían resultar una solución a corto plazo. Como si su rendimiento mediocre no fuera lo suficientemente incómodo, Musk admitió recientemente que xAI ha utilizado modelos de OpenAI para ayudar a entrenar y mejorar Grok. El proceso, conocido como destilación, es estándar cuando las empresas usan sus propios modelos, pero mucho más controvertido cuando implica usar el sistema de un rival. Grok ni siquiera puede vencer a los modelos con los que se está entrenando.

En su versión de consumo pública, Grok es deliberadamente desagradable. Musk ha calificado al chatbot como una alternativa menos sesgada y menos censurada a herramientas como ChatGPT, pero eso se ha traducido en un producto con estándares de evidencia laxos, una obsesión poco saludable con Musk y un largo historial de resultados ofensivos, conspirativos y sexualizados.

Grok Fracasa en la Adopción de IA Gubernamental, Demostrando que Incluso los Burócratas Tienen Estándares

Noticias en tu bandeja.