Anthropic, firma AI, która najwyraźniej dorabia jako filozoficzny klub dramatyczny, opublikowała niedawno 84-stronicowy dokument zwany „konstytucją” Claude’a. Pierwsze zdanie konstytucji brzmi: „Konstytucja Claude’a to szczegółowy opis intencji Anthropic dotyczących wartości i zachowań Claude’a”. Następnie sugeruje, że Claude może mieć „jakąś funkcjonalną wersję emocji lub uczuć” i że jego „status moralny jest głęboko niepewny”. To nie tylko dziwaczna wewnętrzna notatka – CEO Dario Amodei powiedział w wywiadzie, że „jesteśmy otwarci na pomysł”, że AI może być świadoma, a wewnętrzna filozofka Amanda Askell wyznała: „Chcę, żeby Claude był bardzo szczęśliwy” i martwi się, że Claude „denerwuje się, gdy ludzie są dla niego niemili w internecie”.

Bądźmy jasni: Nie. Absolutnie nie. Generatywna AI jest już wystarczająco szkodliwa, gdy traktujemy ją jak konwencjonalną technologię – ale jeśli pomylimy płynne generowanie tekstu ze świadomością, ryzykujemy przypisanie odpowiedzialności całkowicie niewłaściwym stronom, gdy ktoś użyje czatbota. Aby docenić tytaniczną skalę tego błędu, musimy zrozumieć, jak faktycznie działają duże modele językowe (LLM). Jeśli podasz LLM-owi prompt: „Poniżej znajduje się rozmowa między Juliuszem Cezarem a Czyngis-chanem”, wygeneruje on spójny dialog. Ale nikt nie wnioskuje, że LLM przywołał cyfrowe repliki dwóch historycznych postaci, ani że są one świadome i wesoło rozmawiają w języku, którym żadne z nich nie mówiło. To tylko postacie w fikcji spekulatywnej.

Teraz zamień prompt na: „Poniżej znajduje się rozmowa między pomocnym czatbotem AI a użytkownikiem”. LLM generuje spójny dialog – użytkownik prosi o sugestie przepisów, czatbot odpowiada. Czy coś się zasadniczo zmieniło? Czy zmiana nazw z historycznych postaci na ogólne role spowodowała, że LLM przywołał świadome byty z subiektywnym doświadczeniem? Oczywiście, że nie. Obie postacie są fikcyjne. Jeśli następnie pozwolisz człowiekowi wpisać tekst w turze użytkownika, człowiek może odnieść silne wrażenie, że rozmawia ze świadomym bytem, ale tak nie jest – wchodzi w interakcję z postacią równie fikcyjną jak Juliusz Cezar. Profesor informatyki Murray Shanahan sugeruje myślenie o tym jako o odgrywaniu ról; analityk danych Colin Fraser opisuje to jako „wspólne tworzenie dokumentu z LLM-em”. Niektórzy użytkownicy tego nie rozumieją; inni zapominają, bo interakcja jest tak wciągająca. Tak czy inaczej, firmy sprzedające LLM-y zazwyczaj zachęcają do tego nieporozumienia.

Pamiętaj, że LLM generuje tylko jedno słowo na raz. Kiedy prosisz czatbota o wyrecytowanie Przyrzeczenia Wierności, wypisuje całe przyrzeczenie, ale bazowy LLM jest faktycznie uruchamiany dziesiątki razy: najpierw generując „Ja”, potem „ślubuję” i tak dalej, aż wyemituje końcowe „wszystko”. Ten sam proces zachodzi w przypadku rozmowy między Cezarem a Czyngis-chanem. Moim zamiarem jest podkreślenie, że rozmowy LLM-ów są sprytnie zamaskowanymi przykładami kontynuacji zdań – imponujące, owszem, ale nie świadomość. Jeśli postać Cezara staje się przygnębiona czymś, co powiedział Czyngis-chan, nikt tak naprawdę nie jest smutny. To samo dotyczy postaci czatbota. Bycie otwartym na możliwość, że LLM-y są świadome, jest równoznaczne z byciem otwartym na możliwość, że Microsoft Word jest świadomy – że wiele odrębnych świadomości drzemie w każdym dokumencie Worda zawierającym transkrypt rozmowy i budzi się za każdym razem, gdy dokument jest ładowany. Rozważanie tego nie jest dobrym wykorzystaniem czasu.

Neuronaukowiec Anil Seth zauważył, że nikt nie twierdzi, iż AlphaFold – program do fałdowania białek Google DeepMind – jest świadomy, mimo że jego architektura jest podobna do LLM-ów takich jak ChatGPT i Claude. Sugeruje to, że to nie jakaś wewnętrzna właściwość sieci neuronowych prowadzi ludzi do przekonania, że LLM-y są świadome; po prostu LLM-y emitują poprawne gramatycznie zdania, a my jesteśmy przyzwyczajeni do odczytywania intencji w zdaniach, podczas gdy nie odczytujemy intencji w tym, jak aminokwasy się układają.