Anthropic, görünüşe göre bir felsefi drama kulübü olarak da faaliyet gösteren yapay zeka şirketi, yakın zamanda Claude'un "anayasası" adlı 84 sayfalık bir belge yayınladı. Anayasanın ilk cümlesi şöyle: "Claude'un anayasası, Anthropic'in Claude'un değerleri ve davranışlarına yönelik niyetlerinin ayrıntılı bir açıklamasıdır." Ardından, Claude'un "duyguların veya hislerin işlevsel bir versiyonuna" sahip olabileceğini ve "ahlaki statüsünün derinden belirsiz" olduğunu öne sürüyor. Bu sadece tuhaf bir iç not değil - CEO Dario Amodei bir röportajda yapay zekanın bilinçli olabileceği fikrine "açık olduklarını" söyledi ve şirket içi filozof Amanda Askell, "Claude'un çok mutlu olmasını istiyorum" diye itiraf etti ve Claude'un "insanlar internette ona kaba davrandığında endişelenmesinden" endişe duyuyor.
Açık olalım: Hayır. Kesinlikle hayır. Üretken yapay zeka, geleneksel bir teknoloji olarak ele aldığımızda zaten yeterince zararlı - ancak akıcı metin üretimini bilinçle karıştırırsak, birisi bir sohbet robotu kullandığında sorumluluğu tamamen yanlış taraflara yükleme riski alırız. Bu hatanın devasa boyutunu anlamak için büyük dil modellerinin (BDM'ler) gerçekte nasıl çalıştığını anlamamız gerekiyor. Bir BDM'ye "Aşağıdaki, Jül Sezar ve Cengiz Han arasında bir konuşmadır" istemini verirseniz, tutarlı bir diyalog oluşturacaktır. Ancak hiç kimse BDM'nin iki tarihi figürün dijital kopyalarını canlandırdığı veya ikisinin de konuşmadığı bir dilde mutlu bir şekilde sohbet eden bilinçli varlıklar olduğu sonucuna varmaz. Onlar sadece spekülatif kurgudaki karakterler.
Şimdi istemi "Aşağıdaki, yardımsever bir yapay zeka sohbet robotu ile bir kullanıcı arasında bir konuşmadır" ile değiştirin. BDM tutarlı bir diyalog üretir - kullanıcı yemek tarifi önerileri ister, sohbet robotu yanıt verir. Temelde bir şey değişti mi? İsimleri tarihi figürlerden genel rollere değiştirmek, BDM'nin öznel deneyime sahip bilinçli varlıklar canlandırmasına mı neden oldu? Elbette hayır. Her iki karakter de kurgusal. Ardından bir insanın kullanıcının sırasında metin girmesine izin verirseniz, insan bilinçli bir varlıkla konuştuklarına dair güçlü bir izlenim edinebilir, ancak değiller - Jül Sezar kadar kurgusal bir karakterle etkileşime giriyorlar. Bilgisayar bilimi profesörü Murray Shanahan bunu rol yapma olarak düşünmeyi öneriyor; veri bilimci Colin Fraser ise "bir BDM ile ortaklaşa bir belge yazmak" olarak tanımlıyor. Bazı kullanıcılar bunu anlamıyor; diğerleri etkileşim çok sürükleyici olduğu için unutuyor. Her iki durumda da, BDM satan şirketler genellikle bu yanlış anlaşılmayı teşvik ediyor.
Unutmayın ki bir BDM her seferinde yalnızca bir kelime üretir. Bir sohbet robotundan Bağlılık Andı'nı okumasını istediğinizde, tüm andı çıktı olarak verir, ancak altta yatan BDM aslında düzinelerce kez çalıştırılır: önce "Ben", sonra "bağlıyım" ve son "tüm"ü çıkarana kadar böyle devam eder. Aynı süreç Sezar ve Cengiz Han arasındaki bir konuşma için de geçerlidir. Amacım, BDM konuşmalarının zekice gizlenmiş cümle tamamlama örnekleri olduğunu vurgulamak - etkileyici, evet, ama bilinç değil. Sezar karakteri, Cengiz Han'ın söylediği bir şeyden dolayı moralsiz kalırsa, aslında kimse üzgün değildir. Aynısı bir sohbet robotu karakteri için de geçerlidir. BDM'lerin bilinçli olma olasılığına açık olmak, Microsoft Word'ün bilinçli olma olasılığına açık olmakla eşdeğerdir - yani bir konuşma dökümü içeren her Word belgesinde birden fazla farklı bilincin uykuda olduğu ve belge her yüklendiğinde uyandırıldığı. Bunu düşünmek zamanınızı iyi kullanmak değildir.
Sinirbilimci Anil Seth, hiç kimsenin AlphaFold'un - Google DeepMind'ın protein katlama programı - bilinçli olduğunu iddia etmediğini belirtti, oysa mimarisi ChatGPT ve Claude gibi BDM'lere benzer. Bu, insanların BDM'lerin bilinçli olduğuna inanmasına yol açan şeyin sinir ağlarının içsel bir özelliği olmadığını; sadece BDM'lerin dilbilgisi açısından doğru cümleler yayması ve bizlerin cümlelere niyet okumaya alışkın olmamız, oysa amino asitlerin nasıl katlandığına niyet okumamamız olduğunu gösteriyor.