Elon Musk'ın 'gerçeği arayan' yapay zeka sohbet robotu Grok hakkında acı bir gerçek var: Pek iyi değil ve pek çok kişi kullanmıyor. Yeni bir Reuters raporunun çıkarımı bu; rapor, Grok'un ABD hükümetinin geçen yıl yapay zekayı nasıl kullandığına dair federal kayıtlarda neredeyse hiç görünmediğini ortaya koydu. xAI'nin amiral gemisi sohbet robotunun, Musk onu tarihin en büyük halka arzının merkezine koyarken bile, sorunda olduğunun tek işareti bu değil.
Reuters, belirli satıcıların adlandırıldığı 400'den fazla hükümet yapay zeka kullanımı örneğini inceledi. Grok veya xAI, yalnızca üçünde göründü - her biri belge taslağı hazırlama veya sosyal medya yönetimi gibi temel kullanımlar için ve her zaman Microsoft ve OpenAI gibi rakiplerle birlikte. Karşılaştırıldığında, OpenAI'nin modelleri 230'dan fazla örnekte görünürken, Google ve Anthropic düzinelerce kez göründü. Benzer bir model, daha az kullanıcıya sahip daha iddialı hükümet yapay zeka projelerinin başka bir veritabanında da ortaya çıktı. Grok yalnızca üç kez göründü: iki kez Seçim Yardım Komisyonu'nda rutin idari görevler için ve bir kez de Enerji Bakanlığı'nın Lawrence Livermore Ulusal Laboratuvarı'ndaki belge özetleri ve genel araştırma pilotunda. Reuters, Microsoft ve OpenAI'yi içeren 140 giriş bulurken, kısa bir inceleme Anthropic için en az 10 giriş ve Google'ın Gemini'si için düzinelerce giriş buldu.
Listeler, hükümet adaptasyonunun eksik ve düzensiz bir ölçüsüdür. Belirli bir satıcı olmadan listelenen çok daha fazla örnek var ve yapay zekanın ne olduğuna dair evrensel bir tanım yok. Veriler ayrıca istihbarat ajanslarını veya Pentagon'u kapsamıyor - xAI'nin geçen yıl 200 milyon dolarlık bir sözleşme aldığı ve Anthropic'in kara listeye alınmasının ardından gizli ağlarda çalışmak üzere yakın zamanda onaylandığı yer. Yine de, Grok için iyi görünmüyor. Rakiplerinden çok daha az görünüyor ve göründüğünde de çoğunlukla temel idari işler için - Musk'ın yıllardır övündüğü dünya standartlarında öncü model için pek uygun değil.
Reuters ile konuşan kişiler, açıklamanın basit olduğunu öne sürdü: Grok rakipleri kadar iyi değil. İsimsiz bir Pentagon kaynağı, 'Sadece piyasadaki en iyi model değil' dedi ve oradaki personelin Gemini veya Claude'u tercih etme eğiliminde olduğunu ekledi. Yapay zeka modellerini sıralayan halka açık liderlik tabloları bu görüşü destekliyor. Anthropic, Google ve OpenAI üst sıralara hakimken, Grok ara sıra görüntü veya video kategorisi dışında nadiren ilk 10'a giriyor. Bu, Musk için ve SpaceX için daha da utanç verici; SpaceX, xAI'yi bu yılın başlarında bünyesine kattı. Roket girişiminin halka arz başvurusu, şirketin yapay zekayı - ve özellikle Grok'u - yatırımcılara sunumunun merkezine koyduğunu gösteriyor. SpaceX, 'insanlık tarihindeki en büyük uygulanabilir toplam adreslenebilir pazarı' belirlediğini iddia ediyor: şaşırtıcı bir 28,5 trilyon dolarlık fırsat, ancak ne yazık ki oraya ulaşmak için bir zaman çizelgesi sunmuyor. Bu tahmini değerin neredeyse tamamı, roketler veya uydulardan değil, yapay zekadan, özellikle kurumsal yapay zekadan geliyor.
Reuters, Grok'un devlet kurumlarındaki performansının, diğer işyerlerinde de ne kadar iyi olduğuna dair ipucu verebileceğini belirtiyor. xAI'nin kurumsal müşterilere yönelik hamlesinin bir parçası olarak Musk'ın, SpaceX'in halka arzına katılmak isterlerse bankaları Grok aboneliği satın almaya zorladığı bildiriliyor - ancak paralarının karşılığını alamıyorlarsa, bu anlaşmalar kısa vadeli bir düzeltme olabilir. İç karartıcı performansı yeterince utanç verici değilmiş gibi, Musk yakın zamanda xAI'nin Grok'u eğitmek ve geliştirmek için OpenAI'nin modellerini kullandığını itiraf etti. Damıtma olarak bilinen süreç, şirketler kendi modellerini kullanırken standarttır, ancak bir rakibin sistemini kullanmayı içerdiğinde çok daha tartışmalıdır. Grok, eğitim aldığı modelleri bile geçemiyor.
Halka açık tüketici versiyonunda Grok, kasıtlı olarak tatsız. Musk, sohbet robotunu ChatGPT gibi araçlara daha az taraflı ve daha az sansürlü bir alternatif olarak markalaştırdı, ancak bu, gevşek kanıt standartları, Musk'a sağlıksız bir takıntı ve uzun bir saldırgan, komplocu ve cinselleştirilmiş çıktı geçmişine sahip bir ürüne dönüştü.