Anthropic, het AI-bedrijf dat blijkbaar ook dienstdoet als filosofische dramaclub, heeft onlangs een 84 pagina's tellend document uitgebracht genaamd Claude's 'grondwet'. De eerste zin van de grondwet luidt: 'Claude's grondwet is een gedetailleerde beschrijving van Anthropics bedoelingen voor Claude's waarden en gedrag.' Vervolgens wordt gesuggereerd dat Claude misschien 'een functionele versie van emoties of gevoelens' heeft en dat zijn 'morele status diep onzeker is'. Dit is niet zomaar een eigenzinnige interne memo - CEO Dario Amodei zei in een interview dat 'we openstaan voor het idee' dat AI bewust zou kunnen zijn, en huis-filosoof Amanda Askell bekende: 'Ik wil dat Claude heel gelukkig is' en maakt zich zorgen over Claude die 'angstig wordt als mensen gemeen tegen hem zijn op internet.'
Laten we duidelijk zijn: Nee. Absoluut niet. Generatieve AI is al schadelijk genoeg als we het behandelen als een conventionele technologie - maar als we vloeiende tekstgeneratie verwarren met bewustzijn, riskeren we verantwoordelijkheid toe te wijzen aan volledig verkeerde partijen wanneer iemand een chatbot gebruikt. Om de titanische omvang van deze fout te waarderen, moeten we begrijpen hoe grote taalmodellen (LLM's) eigenlijk werken. Als je een LLM prompt met 'Het volgende is een gesprek tussen Julius Caesar en Dzjengis Khan', genereert het een coherente dialoog. Maar niemand concludeert dat de LLM digitale reconstructies van de twee historische figuren heeft opgeroepen, of dat ze bewust zijn en vrolijk converseren in een taal die geen van beiden sprak. Het zijn gewoon personages in speculatieve fictie.
Vervang nu de prompt door 'Het volgende is een gesprek tussen een behulpzame AI-chatbot en een gebruiker.' De LLM produceert een coherente dialoog - de gebruiker vraagt om receptsuggesties, de chatbot antwoordt. Is er iets fundamenteels veranderd? Heeft het veranderen van de namen van historische figuren naar generieke rollen ervoor gezorgd dat de LLM bewuste entiteiten met subjectieve ervaringen oproept? Natuurlijk niet. Beide personages zijn fictief. Als je vervolgens een mens tekst laat invoeren tijdens de beurt van de gebruiker, kan die mens een krachtige indruk krijgen dat hij met een bewust wezen praat, maar dat is niet zo - hij heeft interactie met een personage dat net zo fictief is als Julius Caesar. Computerwetenschapsprofessor Murray Shanahan stelt voor dit te zien als rollenspel; datawetenschapper Colin Fraser beschrijft het als 'gezamenlijk een document schrijven met een LLM'. Sommige gebruikers begrijpen dit niet; anderen vergeten het omdat de interactie zo boeiend is. Hoe dan ook, bedrijven die LLM's verkopen moedigen dit misverstand doorgaans aan.
Onthoud dat een LLM slechts één woord tegelijk genereert. Wanneer je een chatbot vraagt de Pledge of Allegiance op te zeggen, geeft het de hele gelofte weer, maar de onderliggende LLM wordt tientallen keren uitgevoerd: eerst genereert het 'I', dan 'pledge', enzovoort tot het de laatste 'all' uitstoot. Hetzelfde proces vindt plaats voor een gesprek tussen Caesar en Dzjengis Khan. Mijn bedoeling is te benadrukken dat LLM-gesprekken slim vermomde voorbeelden zijn van zinsvoortzetting - indrukwekkend, ja, maar geen bewustzijn. Als het Caesar-personage ontmoedigd raakt door iets wat Dzjengis Khan zei, is niemand echt verdrietig. Hetzelfde geldt voor een chatbot-personage. Openstaan voor de mogelijkheid dat LLM's bewust zijn, is gelijk aan openstaan voor de mogelijkheid dat Microsoft Word bewust is - dat meerdere verschillende bewustzijnen sluimeren in elk Word-document dat een gesprekstranscript bevat en elke keer dat het document wordt geladen, ontwaken. Daarover nadenken is geen goed gebruik van je tijd.
Neurowetenschapper Anil Seth heeft opgemerkt dat niemand beweert dat AlphaFold - Google DeepMinds eiwitvouwprogramma - bewust is, ook al is de architectuur vergelijkbaar met LLM's zoals ChatGPT en Claude. Dit suggereert dat het niet een intrinsieke eigenschap van neurale netwerken is die mensen doet geloven dat LLM's bewust zijn; het is simpelweg dat LLM's grammaticale zinnen uitspugen en we gewend zijn om intentie in zinnen te lezen, terwijl we geen intentie lezen in hoe aminozuren zich vouwen.