أداة جديدة لشركة ناشئة تتيح لك النظر داخل دماغ الذكاء الاصطناعي وخفض صوت هلوساته

أداة Silico من Goodfire تتيح لك تصحيح نماذج الذكاء الاصطناعي مثل الكود السيئ، محولة الخيمياء العصبية إلى شيء يقترب من الهندسة - أو على الأقل تمنحه فركًا جيدًا.

أطلقت الشركة الناشئة Goodfire ومقرها سان فرانسيسكو أداة تسمى Silico تتيح للباحثين والمهندسين النظر داخل نموذج ذكاء اصطناعي وضبط معلماته - الإعدادات التي تحدد سلوك النموذج - أثناء التدريب. قد يمنح هذا صانعي النماذج تحكمًا أدق في كيفية بناء هذه التكنولوجيا مما كان يُعتقد سابقًا أنه ممكن، بشرط ألا يمانعوا في اتساخ أيديهم قليلاً.

تدعي Goodfire أن Silico هي أول أداة جاهزة من نوعها يمكنها مساعدة المطورين في تصحيح جميع مراحل عملية التطوير، بدءًا من بناء مجموعة البيانات وصولاً إلى تدريب النموذج. تقول الشركة إن مهمتها هي جعل بناء نماذج الذكاء الاصطناعي أقل شبهاً بالخيمياء وأكثر شبهاً بالعلم. بالتأكيد، يمكن لنماذج LLM مثل ChatGPT وGemini القيام بأشياء مذهلة. لكن لا أحد يعرف بالضبط كيف أو لماذا تعمل، وهذا قد يجعل من الصعب إصلاح عيوبها أو منع السلوكيات غير المرغوب فيها.

يقول إريك هو، الرئيس التنفيذي لشركة Goodfire، لمجلة MIT Technology Review في مقابلة حصرية قبل إطلاق Silico: "رأينا هذه الفجوة المتسعة بين مدى فهم النماذج ومدى انتشارها على نطاق واسع. أعتقد أن الشعور السائد في كل مختبر رائد رئيسي اليوم هو أنك تحتاج فقط إلى المزيد من الحجم، والمزيد من الحوسبة، والمزيد من البيانات، ثم تحصل على AGI [الذكاء العام الاصطناعي] ولا شيء آخر يهم. ونحن نقول لا، هناك طريقة أفضل."

Goodfire هي واحدة من عدد قليل من الشركات، بما في ذلك رواد الصناعة Anthropic وOpenAI وGoogle DeepMind، التي تبتكر تقنية تُعرف باسم التفسير الآلي، والتي تهدف إلى فهم ما يحدث داخل نموذج الذكاء الاصطناعي عندما ينفذ مهمة من خلال رسم خريطة للخلايا العصبية والمسارات بينها. (اختارت MIT Technology Review التفسير الآلي كواحدة من تقنياتها العشر الرائدة لعام 2026، لذا فأنت تعلم أنها شرعية.) تريد Goodfire استخدام هذا النهج ليس فقط لتدقيق النماذج - أي دراسة تلك التي تم تدريبها بالفعل - ولكن للمساعدة في تصميمها من البداية.

يقول هو: "نريد إزالة التجربة والخطأ وتحويل تدريب النماذج إلى هندسة دقيقة. وهذا يعني كشف المقابض والأقراص بحيث يمكنك استخدامها فعليًا أثناء عملية التدريب." استخدمت Goodfire بالفعل تقنياتها وأدواتها لتعديل سلوكيات نماذج LLM - على سبيل المثال، تقليل عدد الهلوسات التي تنتجها. مع Silico، تقوم الشركة الآن بتجميع العديد من تلك التقنيات الداخلية وشحنها كمنتج.

تستخدم الأداة وكلاء لأتمتة الكثير من العمل المعقد. يقول هو: "الوكلاء الآن أقوياء بما يكفي للقيام بالكثير من أعمال التفسير التي كنا نقوم بها باستخدام البشر. كانت تلك هي الفجوة التي احتاجت إلى سد قبل أن تصبح هذه منصة قابلة للتطبيق يمكن للعملاء استخدامها بأنفسهم."

يعتقد ليونارد بيريسكا، الباحث في جامعة أمستردام الذي عمل على التفسير الآلي، أن Silico تبدو أداة مفيدة. لكنه ينتقد طموحات Goodfire الأسمى. يقول: "في الواقع، هم يضيفون دقة إلى الخيمياء. تسميتها هندسة يجعلها تبدو أكثر مبدئية مما هي عليه."

تتيح لك Silico التكبير على أجزاء محددة من نموذج مدرب، مثل الخلايا العصبية الفردية أو مجموعات من الخلايا العصبية، وإجراء تجارب لمعرفة ما تفعله تلك الخلايا العصبية. (بافتراض أن لديك إمكانية الوصول إلى الأعمال الداخلية للنموذج. لن يتمكن معظم الأشخاص من استخدام Silico للتجسس داخل ChatGPT أو Gemini، ولكن يمكنك استخدامه للنظر في المعلمات داخل العديد من النماذج مفتوحة المصدر.) يمكنك بعد ذلك التحقق من المدخلات التي تجعل الخلايا العصبية المختلفة تنشط، وتتبع المسارات المنبع والمصب من خلية عصبية لمعرفة كيف تؤثر الخلايا العصبية الأخرى عليها وكيف تؤثر هي على الخلايا العصبية الأخرى بدورها.

على سبيل المثال، وجدت Goodfire خلية عصبية داخل النموذج مفتوح المصدر Qwen 3 كانت مرتبطة بما يسمى مشكلة العربة. أدى تنشيط هذه الخلية العصبية إلى تغيير استجابات النموذج، مما جعله يؤطر مخرجاته كمعضلات أخلاقية صريحة. يقول هو: "عندما تكون هذه الخلية العصبية نشطة، تحدث كل أنواع الأشياء الغريبة." تحديد مصدر السلوك الغريب

أداة جديدة لشركة ناشئة تتيح لك النظر داخل دماغ الذكاء الاصطناعي وخفض صوت هلوساته

الأخبار في صندوق بريدك.