Grok Fracassa na Adoção de IA Governamental, Provando que Até Burocratas Têm Padrão

Há uma verdade dura sobre o chatbot de IA 'buscador da verdade' de Elon Musk, Grok: ele não é muito bom, e não são muitas pessoas que o usam. Essa é a conclusão de um novo relatório da Reuters, que descobriu que o Grok mal aparece nos registros federais de como o governo dos EUA usou IA no ano passado. Não é o único sinal de que o chatbot principal da xAI está em apuros, mesmo enquanto Musk o coloca no centro do que pode ser o maior IPO da história.

A Reuters revisou mais de 400 exemplos de uso governamental de IA em que fornecedores específicos foram nomeados. Grok ou xAI apareceram em apenas três — cada um para usos básicos, como redação de documentos ou gerenciamento de mídias sociais, e sempre ao lado de concorrentes como Microsoft e OpenAI. Os modelos da OpenAI, em comparação, apareceram em mais de 230 exemplos, enquanto Google e Anthropic apareceram dezenas de vezes cada. Um padrão semelhante apareceu em outro banco de dados de projetos governamentais de IA mais ambiciosos, com números menores de usuários. Grok apareceu apenas três vezes: duas para tarefas administrativas rotineiras na Comissão de Assistência Eleitoral, e uma em um piloto do Departamento de Energia no Laboratório Nacional Lawrence Livermore para resumos de documentos e pesquisa geral. A Reuters encontrou 140 entradas envolvendo Microsoft e OpenAI, enquanto uma breve revisão encontrou pelo menos 10 entradas para Anthropic e dezenas para o Gemini do Google.

As listas são uma medida incompleta e irregular da adoção governamental. Muitos outros exemplos são listados sem um fornecedor específico, e não há uma definição universal do que conta como IA. Os dados também não capturam agências de inteligência ou o Pentágono — onde a xAI garantiu um contrato de US$ 200 milhões no ano passado e foi recentemente autorizada a operar em redes classificadas após a inclusão da Anthropic na lista negra. Ainda assim, não é bom para o Grok. Ele aparece muito menos que seus rivais, e quando aparece, é principalmente para trabalho administrativo básico — dificilmente condizente com o modelo de fronteira mundial que Musk tem ostentado por anos.

Pessoas que falaram com a Reuters sugeriram que a explicação é simples: Grok não é tão bom quanto seus rivais. 'Simplesmente não é o melhor modelo disponível', disse uma fonte anônima do Pentágono, acrescentando que os funcionários de lá tendem a preferir Gemini ou Claude. Rankings públicos de modelos de IA dão peso a essa visão. Anthropic, Google e OpenAI dominam os primeiros lugares, enquanto Grok raramente entra no top 10, exceto em alguma categoria ocasional de imagem ou vídeo. Isso é estranho para Musk, e ainda mais estranho para a SpaceX, que absorveu a xAI no início deste ano. O pedido de IPO da empresa de foguetes mostra que a empresa colocou a IA — e o Grok especificamente — no centro de sua proposta para investidores. A SpaceX afirma ter identificado 'o maior mercado endereçável acionável da história humana': uma oportunidade impressionante de US$ 28,5 trilhões, embora, infelizmente, não ofereça um cronograma para chegar lá. Praticamente todo esse valor estimado vem da IA, especialmente IA empresarial, não de foguetes ou satélites.

A Reuters observa que o desempenho do Grok em agências governamentais pode indicar como ele se sai em outros locais de trabalho também. Como parte do impulso da xAI para clientes empresariais, Musk supostamente coagiu bancos a comprar assinaturas do Grok se desejassem participar do IPO da SpaceX — mas se eles não estiverem obtendo valor pelo dinheiro, esses acordos podem ser uma solução de curto prazo. Como se seu desempenho medíocre não fosse estranho o suficiente, Musk admitiu recentemente que a xAI usou modelos da OpenAI para ajudar a treinar e melhorar o Grok. O processo, conhecido como destilação, é padrão quando as empresas usam seus próprios modelos, mas muito mais controverso quando envolve o uso do sistema de um rival. Grok não consegue nem vencer os modelos nos quais está sendo treinado.

Em sua versão pública voltada ao consumidor, o Grok é deliberadamente desagradável. Musk rotulou o chatbot como uma alternativa menos tendenciosa e menos censurada a ferramentas como ChatGPT, mas isso se traduziu em um produto com padrões de evidência frouxos, uma obsessão doentia por Musk e um longo histórico de resultados ofensivos, conspiratórios e sexualizados. Até

Grok Fracassa na Adoção de IA Governamental, Provando que Até Burocratas Têm Padrão

Notícias na sua caixa.