Grok يفشل في تبني الذكاء الاصطناعي الحكومي، مما يثبت حتى البيروقراطيين لديهم معايير

هناك حقيقة قاسية حول روبوت الدردشة 'الباحث عن الحقيقة' لإيلون ماسك، Grok: إنه ليس جيدًا جدًا، ولا يستخدمه الكثير من الناس. هذا هو الاستنتاج من تقرير جديد لرويترز، والذي وجد أن Grok بالكاد يظهر في السجلات الفيدرالية لكيفية استخدام الحكومة الأمريكية للذكاء الاصطناعي العام الماضي. إنها ليست العلامة الوحيدة على أن روبوت الدردشة المميز لـ xAI في ورطة، حتى مع وضعه ماسك في قلب ما قد يكون أكبر اكتتاب عام أولي في التاريخ.

استعرضت رويترز أكثر من 400 مثال لاستخدام الحكومة للذكاء الاصطناعي حيث تم تسمية بائعين محددين. ظهر Grok أو xAI في ثلاثة فقط - كل منها لاستخدامات أساسية مثل صياغة المستندات أو إدارة وسائل التواصل الاجتماعي، ودائمًا إلى جانب منافسين مثل Microsoft و OpenAI. نماذج OpenAI، بالمقارنة، ظهرت في أكثر من 230 مثالًا، بينما ظهرت Google و Anthropic كل منهما عشرات المرات. ظهر نمط مماثل في قاعدة بيانات أخرى لمشاريع حكومية أكثر طموحًا للذكاء الاصطناعي بأعداد أقل من المستخدمين. ظهر Grok ثلاث مرات فقط: مرتين للمهام الإدارية الروتينية في لجنة مساعدة الانتخابات، ومرة واحدة في مشروع تجريبي لوزارة الطاقة في مختبر لورانس ليفرمور الوطني لتلخيص المستندات والبحث العام. وجدت رويترز 140 إدخالًا يتضمن Microsoft و OpenAI، بينما وجد مراجعة موجزة ما لا يقل عن 10 إدخالات لـ Anthropic وعشرات لـ Gemini من Google.

القوائم هي مقياس غير مكتمل ومجزئ لتبني الحكومة. العديد من الأمثلة الأخرى مدرجة بدون بائع محدد، ولا يوجد تعريف عالمي لما يعتبر ذكاء اصطناعي. البيانات أيضًا لا تشمل وكالات الاستخبارات أو البنتاغون - حيث حصلت xAI على عقد بقيمة 200 مليون دولار العام الماضي وتم تصفيتها مؤخرًا للعمل على الشبكات المصنفة بعد حظر Anthropic. ومع ذلك، فإن الأمر لا يبدو جيدًا لـ Grok. يظهر أقل بكثير من منافسيه، وعندما يظهر، يكون في الغالب لأعمال إدارية أساسية - لا يليق بالنموذج الرائد عالميًا الذي تفاخر به ماسك لسنوات.

أشار الأشخاص الذين تحدثوا إلى رويترز إلى أن التفسير بسيط: Grok ليس جيدًا مثل منافسيه. قال مصدر مجهول في البنتاغون إنه 'ليس أفضل نموذج موجود'، مضيفًا أن الموظفين هناك يميلون إلى تفضيل Gemini أو Claude. لوحات المتصدرين العامة لترتيب نماذج الذكاء الاصطناعي تدعم هذا الرأي. تهيمن Anthropic و Google و OpenAI على المراتب العليا، بينما نادرًا ما يكسر Grok المراكز العشرة الأولى خارج فئة الصور أو الفيديو أحيانًا. هذا محرج لماسك، وأكثر إحراجًا لـ SpaceX، التي استوعبت xAI في وقت سابق من هذا العام. يُظهر ملف الاكتتاب العام للشركة الصاروخية أن الشركة وضعت الذكاء الاصطناعي - و Grok على وجه التحديد - في قلب عرضها للمستثمرين. تدعي SpaceX أنها حددت 'أكبر سوق قابل للاستهداف في تاريخ البشرية': فرصة مذهلة بقيمة 28.5 تريليون دولار، لكن للأسف، لا تقدم جدولًا زمنيًا للوصول إلى هناك. تقريبًا كل هذه القيمة المقدرة تأتي من الذكاء الاصطناعي، وخاصة الذكاء الاصطناعي للمؤسسات، وليس الصواريخ أو الأقمار الصناعية.

تلاحظ رويترز أن أداء Grok في الوكالات الحكومية قد يشير إلى أدائه في أماكن العمل الأخرى أيضًا. كجزء من دفع xAI لعملاء المؤسسات، أفادت التقارير أن ماسك ضغط على البنوك لشراء اشتراكات Grok إذا كانت ترغب في المشاركة في اكتتاب SpaceX العام - ولكن إذا لم تحصل على قيمة أموالها، فقد تكون هذه الصفقات حلاً قصير الأجل. كما لو أن أداءه الكئيب لم يكن محرجًا بما فيه الكفاية، اعترف ماسك مؤخرًا أن xAI استخدمت نماذج OpenAI للمساعدة في تدريب وتحسين Grok. العملية، المعروفة باسم التقطير، قياسية عندما تستخدم الشركات نماذجها الخاصة، ولكنها أكثر إثارة للجدل عندما تتضمن استخدام نظام منافس. Grok لا يمكنه حتى التغلب على النماذج التي يتدرب عليها.

في نسخته الاستهلاكية العامة، Grok غير سار عمدًا. لقد وصف ماسك الروبوت بأنه بديل أقل تحيزًا وأقل رقابة لأدوات مثل ChatGPT، لكن هذا ترجم إلى منتج بمعايير إثبات فضفاضة، وهوس غير صحي بماسك، وسجل طويل من المخرجات المسيئة والتآمرية والجنسية. حتى

Grok يفشل في تبني الذكاء الاصطناعي الحكومي، مما يثبت حتى البيروقراطيين لديهم معايير

الأخبار في صندوق بريدك.