Grok Fallisce nell'Adozione Governativa di AI, Dimostrando che Anche i Burocrati Hanno Standard

C'è una dura verità sul chatbot AI 'in cerca di verità' di Elon Musk, Grok: non è molto buono, e non molte persone lo usano. Questo è il succo di un nuovo rapporto di Reuters, che ha scoperto che Grok appare a malapena nei registri federali di come il governo USA ha usato l'AI l'anno scorso. Non è l'unico segno che il chatbot di punta di xAI sia in difficoltà, anche mentre Musk lo mette al centro di quella che potrebbe essere la più grande IPO della storia.

Reuters ha esaminato oltre 400 esempi di uso governativo dell'AI in cui erano nominati fornitori specifici. Grok o xAI sono apparsi solo in tre - ciascuno per usi di base come la stesura di documenti o la gestione dei social media, e sempre insieme a concorrenti come Microsoft e OpenAI. I modelli di OpenAI, in confronto, sono apparsi in oltre 230 esempi, mentre Google e Anthropic sono apparsi ciascuno decine di volte. Un modello simile è emerso in un altro database di progetti governativi di AI più ambiziosi con numeri minori di utenti. Grok è apparso solo tre volte: due per compiti amministrativi di routine presso la Election Assistance Commission, e una in un progetto pilota del Dipartimento dell'Energia al Lawrence Livermore National Laboratory per riassunti di documenti e ricerca generale. Reuters ha trovato 140 voci che coinvolgono Microsoft e OpenAI, mentre una breve revisione ha trovato almeno 10 voci per Anthropic e decine per Google Gemini.

Le liste sono una misura incompleta e frammentaria dell'adozione governativa. Molti altri esempi sono elencati senza un fornitore specifico, e non esiste una definizione universale di cosa conta come AI. I dati inoltre non catturano le agenzie di intelligence o il Pentagono - dove xAI ha ottenuto un contratto da 200 milioni di dollari l'anno scorso ed è stato recentemente autorizzato a operare su reti classificate dopo la messa al bando di Anthropic. Tuttavia, non è un buon segno per Grok. Appare molto meno dei suoi rivali, e quando appare, è principalmente per lavori amministrativi di base - difficilmente all'altezza del modello di frontiera di livello mondiale di cui Musk si vanta da anni.

Le persone che hanno parlato con Reuters hanno suggerito che la spiegazione è semplice: Grok non è buono come i suoi rivali. 'Semplicemente non è il miglior modello là fuori', ha detto una fonte anonima del Pentagono, aggiungendo che il personale tende a preferire Gemini o Claude. Le classifiche pubbliche che valutano i modelli AI danno peso a questa visione. Anthropic, Google e OpenAI dominano le prime posizioni, mentre Grok raramente entra nella top 10 al di fuori dell'occasionale categoria di immagini o video. Questo è imbarazzante per Musk, e ancora più imbarazzante per SpaceX, che ha assorbito xAI all'inizio di quest'anno. Il documento di IPO dell'azienda spaziale mostra che l'azienda ha messo l'AI - e Grok in particolare - al centro della sua proposta agli investitori. SpaceX sostiene di aver identificato 'il più grande mercato totale indirizzabile azionabile nella storia umana': una sbalorditiva opportunità da 28,5 trilioni di dollari, anche se, purtroppo, non offre una tempistica per arrivarci. Praticamente tutto questo valore stimato proviene dall'AI, in particolare dall'AI aziendale, non dai razzi o dai satelliti.

Reuters nota che la performance di Grok nelle agenzie governative potrebbe dare un'idea di come se la cavi anche in altri luoghi di lavoro. Come parte della spinta di xAI per i clienti aziendali, Musk avrebbe costretto le banche ad acquistare abbonamenti a Grok se desiderano partecipare all'IPO di SpaceX - ma se non ottengono un buon rapporto qualità-prezzo, questi accordi potrebbero rivelarsi una soluzione a breve termine. Come se la sua performance desolante non fosse già abbastanza imbarazzante, Musk ha recentemente ammesso che xAI ha usato i modelli di OpenAI per aiutare ad addestrare e migliorare Grok. Il processo, noto come distillazione, è standard quando le aziende usano i propri modelli, ma molto più controverso quando implica l'uso del sistema di un rivale. Grok non riesce nemmeno a battere i modelli su cui si sta addestrando.

Nella sua versione consumer pubblica, Grok è deliberatamente sgradevole. Musk ha marchiato il chatbot come un'alternativa meno di parte e meno censurata a strumenti come ChatGPT, ma ciò si è tradotto in un prodotto con standard probatori laschi, un'ossessione malsana per Musk, e una lunga storia di output offensivi, cospirativi e sessualizzati. Anche

Grok Fallisce nell'Adozione Governativa di AI, Dimostrando che Anche i Burocrati Hanno Standard

Notizie nella tua casella.