Anthropic, compania de AI care aparent face și muncă de club de dramă filozofică, a publicat recent un document de 84 de pagini numit „constituția” lui Claude. Prima frază a constituției spune: „Constituția lui Claude este o descriere detaliată a intențiilor Anthropic privind valorile și comportamentele lui Claude.” Apoi sugerează că Claude ar putea avea „o versiune funcțională a emoțiilor sau sentimentelor” și că „statutul său moral este profund incert.” Nu e doar un memou intern excentric – CEO-ul Dario Amodei a spus într-un interviu că „suntem deschiși ideii” că AI ar putea fi conștient, iar filozoful angajat Amanda Askell a mărturisit: „Vreau ca Claude să fie foarte fericit” și se îngrijorează că Claude „devine anxios când oamenii sunt răi cu el pe internet.”

Să fim clari: Nu. Absolut nu. AI-ul generativ este deja suficient de dăunător când îl tratăm ca pe o tehnologie convențională – dar dacă confundăm generarea fluentă de text cu conștiința, riscăm să atribuim responsabilitatea unor părți complet greșite atunci când cineva folosește un chatbot. Pentru a aprecia magnitudinea titanică a acestei erori, trebuie să înțelegem cum funcționează de fapt modelele de limbaj mari (LLM-uri). Dacă dai unui LLM promptul „Următoarea este o conversație între Iulius Cezar și Genghis Han,” va genera un dialog coerent. Dar nimeni nu concluzionează că LLM-ul a creat recreări digitale ale celor două figuri istorice sau că sunt conștiente și conversează fericite într-o limbă pe care niciunul n-o vorbea. Sunt doar personaje de ficțiune speculativă.

Acum înlocuiește promptul cu „Următoarea este o conversație între un chatbot AI util și un utilizator.” LLM-ul produce un dialog coerent – utilizatorul cere sugestii de rețete, chatbotul răspunde. S-a schimbat ceva fundamental? Schimbarea numelor de la figuri istorice la roluri generice a făcut ca LLM-ul să creeze entități conștiente cu experiență subiectivă? Desigur că nu. Ambele personaje sunt fictive. Dacă apoi lași un om să introducă text în timpul rândului utilizatorului, omul poate avea impresia puternică că vorbește cu o entitate conștientă, dar nu – interacționează cu un personaj la fel de fictiv ca Iulius Cezar. Profesorul de informatică Murray Shanahan sugerează să ne gândim la asta ca la un joc de rol; omul de știință de date Colin Fraser o descrie ca „scrierea colaborativă a unui document cu un LLM.” Unii utilizatori nu înțeleg asta; alții uită pentru că interacțiunea este atât de captivantă. Oricum, companiile care vând LLM-uri încurajează de obicei această neînțelegere.

Amintește-ți că un LLM generează doar un cuvânt odată. Când întrebi un chatbot să recite „Jurământul de credință,” acesta scoate întregul jurământ, dar LLM-ul de bază rulează de fapt de zeci de ori: mai întâi generează „Eu,” apoi „jur,” și așa mai departe până când emite ultimul „toți.” Același proces are loc pentru o conversație între Cezar și Genghis Han. Intenția mea este să subliniez că conversațiile LLM sunt exemple deghizate inteligent de continuare a propozițiilor – impresionant, da, dar nu conștiință. Dacă personajul Cezar devine descurajat de ceva ce a spus Genghis Han, nimeni nu e de fapt trist. Același lucru se aplică unui personaj chatbot. A fi deschis posibilității ca LLM-urile să fie conștiente este echivalent cu a fi deschis posibilității ca Microsoft Word să fie conștient – că multiple conștiințe distincte zac latente în fiecare document Word care conține o transcriere a unei conversații și sunt trezite de fiecare dată când documentul este încărcat. A contempla asta nu este o bună utilizare a timpului tău.

Neuroștiințificul Anil Seth a observat că nimeni nu pretinde că AlphaFold – programul de pliere a proteinelor de la Google DeepMind – este conștient, chiar dacă arhitectura sa este similară cu LLM-uri precum ChatGPT și Claude. Asta sugerează că nu este vreo proprietate intrinsecă a rețelelor neuronale care îi face pe oameni să creadă că LLM-urile sunt conștiente; este pur și simplu că LLM-urile emit propoziții gramaticale și suntem obișnuiți să citim intenție în propoziții, în timp ce nu citim intenție în modul în care se pliază aminoacizii.