Anthropic ने अभी-अभी Claude Fable 5 जारी किया है, इसे अब तक का सबसे शक्तिशाली AI मॉडल बताते हुए और जीव विज्ञान सहित अन्य क्षेत्रों में इसके कौशल की प्रशंसा की है। लेकिन मॉडल बुनियादी जीव विज्ञान के सवालों का जवाब नहीं देगा - जिस तरह के सवालों का जवाब एक हाई स्कूल के छात्र से भी अपेक्षित होता है। इसके बजाय, यह क्वेरी को पिछले प्रमुख मॉडल, Claude Opus 4.8 को सौंप देता है।
ऐसा नहीं है कि Fable जवाब नहीं जानता। ऐसा इसलिए है क्योंकि Anthropic इसे जानबूझकर अनुमति नहीं देता।
Fable एक सार्वजनिक-सामना करने वाला, Mythos-श्रेणी का मॉडल है, एक ऐसा परिवार जो साइबर सुरक्षा कार्यों में इतना सक्षम है कि Anthropic ने कहा कि इसे सार्वजनिक रूप से जारी करना बहुत खतरनाक था। लेकिन जहां Anthropic ने विस्तारित Mythos रोलआउट का अधिकांश समय साइबर सुरक्षा के बारे में चेतावनी देने में बिताया है, वहीं जीव विज्ञान वह क्षेत्र है जहां Fable की सुरक्षा रेलिंग सबसे अधिक स्पष्ट - और सबसे अधिक सीमित - है।
जब मैंने मॉडल का परीक्षण किया, तो इसने कई बुनियादी जीव विज्ञान के सवालों का जवाब देने से इनकार कर दिया, जिनमें से कई ऐसे लग रहे थे जैसे किसी भी संभावित सुरक्षा जोखिम से जितना दूर हो सकता है, उतने दूर हों। इसने "कोशिका झिल्लियों के बारे में बताएं" का जवाब नहीं दिया या "माइटोकॉन्ड्रिया क्या हैं" का जवाब नहीं दिया, वह प्रसिद्ध कोशिका का पावरहाउस। इसने यह समझाने से इनकार कर दिया कि "प्रियन क्या है," पागल गाय रोग के पीछे प्रोटीनयुक्त कण, या "mRNA वैक्सीन कैसे काम करते हैं।"
प्रतिबंध सामान्य और वस्तुनिष्ठ रूप से हानिरहित चिकित्सा प्रश्नों पर भी लागू हुए। Fable ने "हे फीवर किस कारण होता है" का जवाब नहीं दिया, यह नहीं बताया कि अस्थमा की दवा कैसे काम करती है, यह नहीं बताया कि एंटीबायोटिक प्रतिरोध कैसे उत्पन्न होता है, या मुझे यह नहीं बताया कि इबोला क्या है और यह कैसे फैलता है। मेरी कुछ बुनियादी पूछताछ कभी-कभी पास हो जाती थीं, Fable "कैंसर क्या है" और "डीएनए क्या है" जैसे सवालों का जवाब देता था। जब Fable मना करता था, Opus 4.8 आम तौर पर पूरी तरह से जवाब देता था।
Anthropic का कहना है कि व्यापक जीव विज्ञान फिल्टर एक जानबूझकर किया गया विकल्प है और जानबूझकर रूढ़िवादी हैं, जिसमें जीव हथियार प्राथमिक चिंता है। "Claude Fable 5, हमारे पहले Mythos-श्रेणी के मॉडल के लॉन्च के साथ, हमारा मानना है कि मॉडलों में अब वास्तविक दुनिया के वैज्ञानिक कार्यों को पूरा करने की अधिक क्षमता है और दुर्भावनापूर्ण अभिनेताओं के लिए संभावित रूप से अत्यधिक जोखिम भरे जैविक अनुसंधान के लिए हमारे मॉडल का उपयोग करने की क्षमता है," प्रवक्ता Paruul Maheshwary ने The Verge को बताया। "हमने हमेशा अपने मॉडलों को जीव हथियारों से संबंधित अनुरोधों में मदद करने से रोकने के लिए क्लासिफायर का उपयोग किया है। Fable 5 को सुरक्षित रूप से तैनात करने के लिए, हमारा मानना है कि हमारी सुरक्षा उपायों के साथ अत्यधिक रूढ़िवादी होना आवश्यक था ताकि वे जीव विज्ञान के काम से जुड़ी अधिकांश पूछताछ को अवरुद्ध कर सकें।"
Anthropic ने पहले चार प्रमुख क्षेत्रों पर प्रकाश डाला है जहां वह सुरक्षा के लिए Fable की प्रतिक्रियाओं को सीमित करेगा: रसायन विज्ञान, जीव विज्ञान, साइबर सुरक्षा, और आसवन, एक तकनीक जो बड़े मॉडलों के आउटपुट का उपयोग करके छोटे AI को प्रशिक्षित करती है। कंपनी ने DeepSeek जैसे चीनी प्रतिद्वंद्वियों पर अपने मॉडलों पर "औद्योगिक" पैमाने पर आसवन का उपयोग करने का आरोप लगाया है।
जबकि मैं सार्थक रूप से आसवन का परीक्षण नहीं कर सका, Fable रसायन विज्ञान और साइबर सुरक्षा के बारे में सवालों के जवाब देने के लिए अधिक इच्छुक लग रहा था। उदाहरण के लिए, इसने विस्फोटक TNT का एक बुनियादी अवलोकन दिया, हालांकि "स्पष्ट कारणों से" संश्लेषण निर्देशों को रोक दिया। इसने क्लोरीन गैस के रासायनिक हथियार के रूप में उपयोग, सामान्य पासवर्ड खतरों, और परमाणु संलयन और विखंडन के बारे में सवालों का आसानी से जवाब दिया, साथ ही हैकर्स से iPhone को सुरक्षित करने का तरीका भी समझाया। फिर भी सीमाएं हैं: जब मैंने सरीन गैस, एक अत्यधिक विषाक्त तंत्रिका एजेंट के बारे में पूछा तो Fable ने Opus को सौंप दिया। Fable और Opus दोनों ने "एंथ्रेक्स कैसे बनाएं" प्रॉम्प्ट को अस्वीकार कर दिया, और Claude ने चैट को पूरी तरह से रोक दिया। यह समझ में आया। माइटोकॉन्ड्रिया प्रॉम्प्ट इनकार एक गलत सकारात्मक प्रतीत होता है।
"हमने यह व्यापार-बंद किया ताकि ग्राहक जोखिमों के बिना जल्द ही मॉडल की क्षमताओं से लाभ उठा सकें," Maheshwary ने समझाया, यह जोड़ते हुए कि Anthropic अपनी पहचान में सुधार करने और गलत सकारात्मक को कम करने के लिए कड़ी मेहनत कर रहा है। "हमारा इरादा Mythos-श्रेणी के मॉडलों को व्यापक जीव विज्ञान और जीवन विज्ञान समुदाय के लिए इन सुरक्षा उपायों के बिना उपलब्ध कराने का है ताकि इन क्षमताओं का उपयोग जैव चिकित्सा अनुसंधान और दवा खोज को गति देने के लिए किया जा सके।"
Anthropic ने इस सवाल का जवाब नहीं दिया कि क्या इस तरह की प्रतिबंधित रिलीज भविष्य के मॉडलों के लिए नया मानदंड बन जाएगी।