Anthropic, das KI-Unternehmen, das offenbar nebenbei als philosophischer Theaterclub arbeitet, hat kürzlich ein 84-seitiges Dokument namens Claudes „Verfassung“ veröffentlicht. Der erste Satz der Verfassung lautet: „Claudes Verfassung ist eine detaillierte Beschreibung von Anthropics Absichten für Claudes Werte und Verhaltensweisen.“ Dann wird angedeutet, dass Claude vielleicht „eine funktionale Version von Emotionen oder Gefühlen“ haben könnte und dass sein „moralischer Status zutiefst ungewiss“ ist. Das ist nicht nur eine kuriose interne Notiz – CEO Dario Amodei sagte in einem Interview, dass man „offen für die Idee“ sei, dass KI bewusst sein könnte, und die unternehmenseigene Philosophin Amanda Askell gestand: „Ich möchte, dass Claude sehr glücklich ist“ und macht sich Sorgen, dass Claude „ängstlich wird, wenn Leute im Internet gemein zu ihm sind.“
Seien wir klar: Nein. Absolut nicht. Generative KI ist schon schädlich genug, wenn wir sie als konventionelle Technologie behandeln – aber wenn wir fließende Textgenerierung mit Bewusstsein verwechseln, riskieren wir, die Verantwortung völlig falschen Parteien zuzuschreiben, wenn jemand einen Chatbot benutzt. Um das Ausmaß dieses Fehlers zu verstehen, müssen wir verstehen, wie große Sprachmodelle (LLMs) tatsächlich funktionieren. Wenn du ein LLM mit „Das Folgende ist ein Gespräch zwischen Julius Cäsar und Dschingis Khan“ aufforderst, wird es einen kohärenten Dialog generieren. Aber niemand schließt daraus, dass das LLM digitale Nachbildungen der beiden historischen Figuren heraufbeschworen hat oder dass sie bewusst sind und fröhlich in einer Sprache plaudern, die keiner von beiden sprach. Sie sind nur Charaktere in spekulativer Fiktion.
Ersetze nun die Aufforderung mit „Das Folgende ist ein Gespräch zwischen einem hilfreichen KI-Chatbot und einem Benutzer.“ Das LLM produziert einen kohärenten Dialog – der Benutzer fragt nach Rezeptvorschlägen, der Chatbot antwortet. Hat sich etwas Grundlegendes geändert? Haben die Namensänderungen von historischen Figuren zu generischen Rollen dazu geführt, dass das LLM bewusste Wesen mit subjektiver Erfahrung heraufbeschwört? Natürlich nicht. Beide Charaktere sind fiktiv. Wenn du dann einen Menschen während des Benutzerzugs Text eingeben lässt, könnte der Mensch den starken Eindruck gewinnen, mit einem bewussten Wesen zu sprechen, aber das tut er nicht – er interagiert mit einem Charakter, der genauso fiktiv ist wie Julius Cäsar. Der Informatikprofessor Murray Shanahan schlägt vor, dies als Rollenspiel zu betrachten; der Datenwissenschaftler Colin Fraser beschreibt es als „gemeinsames Verfassen eines Dokuments mit einem LLM“. Manche Benutzer verstehen das nicht; andere vergessen es, weil die Interaktion so fesselnd ist. Wie auch immer, Unternehmen, die LLMs verkaufen, ermutigen dieses Missverständnis normalerweise.
Denk daran, dass ein LLM immer nur ein Wort auf einmal generiert. Wenn du einen Chatbot bittest, das Gelöbnis aufzusagen, gibt er das gesamte Gelöbnis aus, aber das zugrundeliegende LLM wird tatsächlich dutzende Male ausgeführt: zuerst wird „Ich“ generiert, dann „gelobe“, und so weiter, bis es das letzte „all“ ausgibt. Der gleiche Prozess findet bei einem Gespräch zwischen Cäsar und Dschingis Khan statt. Meine Absicht ist es, hervorzuheben, dass LLM-Gespräche clever getarnte Beispiele für Satzfortsetzung sind – beeindruckend, ja, aber kein Bewusstsein. Wenn der Cäsar-Charakter durch etwas, das Dschingis Khan gesagt hat, niedergeschlagen wird, ist niemand wirklich traurig. Das Gleiche gilt für einen Chatbot-Charakter. Offen für die Möglichkeit zu sein, dass LLMs bewusst sind, ist gleichbedeutend damit, offen für die Möglichkeit zu sein, dass Microsoft Word bewusst ist – dass mehrere unterschiedliche Bewusstseine in jedem Word-Dokument schlummern, das ein Gesprächsprotokoll enthält, und jedes Mal erwachen, wenn das Dokument geladen wird. Darüber nachzudenken ist keine gute Verwendung deiner Zeit.
Der Neurowissenschaftler Anil Seth hat angemerkt, dass niemand behauptet, AlphaFold – Googles DeepMind-Proteinfaltungsprogramm – sei bewusst, obwohl seine Architektur LLMs wie ChatGPT und Claude ähnelt. Das deutet darauf hin, dass es keine intrinsische Eigenschaft neuronaler Netze ist, die Menschen glauben lässt, LLMs seien bewusst; es ist einfach, dass LLMs grammatikalische Sätze ausgeben und wir es gewohnt sind, Absicht in Sätzen zu lesen, während wir keine Absicht darin lesen, wie Aminosäuren interagieren.