Im Februar sammelte dieser Reporter auf einem Anti-KI-Marsch in London ein Flugblatt auf. Darauf stand, in einer möglicherweise absichtlichen Hommage an die Unterhosen-Gnome aus South Park: „Schritt 1: Züchte ein digitales Superhirn. Schritt 2: ? Schritt 3: ?“ Hergestellt von Pause AI, einer Aktivistengruppe, die den Protest mitorganisierte, endete das Flugblatt mit der Bitte: „Pausiert KI, bis wir wissen, was zur Hölle Schritt 2 ist.“
Der Hinweis für Uneingeweihte bezieht sich auf die South-Park-Folge von 1998, in der Kenny, Kyle, Cartman und Stan Gnome entdecken, deren Geschäftsplan lautet: „Phase 1: Unterhosen sammeln. Phase 2: ? Phase 3: Profit.“ Seitdem wird das Meme verwendet, um alles von Startup-Strategien bis zu Elon Musks Finanzierungsplan für die Mars-Mission zu persiflieren. Derzeit fasst es den Zustand der KI perfekt zusammen: Unternehmen haben die Technologie gebaut (Schritt 1) und Transformation versprochen (Schritt 3). Wie sie dorthin gelangen, bleibt ein großes Fragezeichen.
Pause AI glaubt, dass Schritt 2 Regulierung beinhalten muss, auch wenn genau das, wie das aussieht und wer es durchsetzt, umstritten ist. KI-Befürworter hingegen sind überzeugt, dass Schritt 3 die Erlösung ist, und neigen dazu, den mittleren Teil ganz zu überspringen. OpenAIs Chefwissenschaftler Jakub Pachocki beschrieb KI mir gegenüber als „wirtschaftlich transformative Technologie“, mit den sonnigen Höhen offenbar direkt über dem Horizont. Aber jeder nimmt eine andere Route, und es ist jedermanns Sache, wer es schafft.
Für jede große Behauptung über die Zukunft gibt es eine ernüchternde Realitätsprüfung. Betrachten wir zwei aktuelle Studien. Eine von Anthropic sagte voraus, welche Berufe LLMs am meisten betreffen werden – Manager, Architekten und Medientypen sollten sich auf Veränderungen gefasst machen; Gärtner, Bauarbeiter und Gastgewerbeleute weniger. Aber diese Vorhersagen sind eigentlich nur Schätzungen, die darauf basieren, worin LLMs gut zu sein scheinen, nicht darauf, wie sie tatsächlich am Arbeitsplatz abschneiden.
Eine weitere Studie vom Februar von Forschern bei Mercor, einem KI-Einstellungs-Startup, testete mehrere KI-Agenten, die von Top-Modellen von OpenAI, Anthropic und Google DeepMind angetrieben wurden, bei 480 Arbeitsaufgaben, die routinemäßig von menschlichen Bankern, Beratern und Anwälten erledigt werden. Jeder Agent scheiterte daran, die meisten seiner Pflichten zu erfüllen.
Warum diese große Uneinigkeit? Zunächst einmal: Wer macht die Behauptungen und warum – Anthropic hat ein Eigeninteresse. Die meisten Leute, die uns sagen, dass etwas Großes passieren wird, stützen sich darauf, wie schnell sich KI-Codierungswerkzeuge verbessern. Aber nicht alle Aufgaben können mit Codierung gehackt werden. Andere Studien zeigen, dass LLMs schlecht bei strategischen Urteilsentscheidungen sind.
Hinzu kommt: Werkzeuge werden nicht in Reinräume geworfen. Sie müssen an Orten funktionieren, die mit Menschen und bestehenden Arbeitsabläufen kontaminiert sind, und manchmal macht das Hinzufügen von KI die Dinge schlimmer. Sicher, vielleicht müssen diese Arbeitsabläufe aufgerissen und um die neue Technologie herum neu gestaltet werden, aber das braucht Zeit und Mut.
Dieses große Loch? Es ist genau dort, wo Schritt 2 sein sollte. Der Mangel an Einigkeit darüber, was passieren wird und wie, schafft ein Informationsvakuum, das von der neuesten wilden Behauptung der Woche gefüllt wird, Beweise hin oder her. Wir sind so sehr von jedem echten Verständnis losgelöst, dass ein einziger Social-Media-Beitrag Märkte erschüttern kann.
Wir brauchen weniger Schätzungen und mehr Beweise. Das erfordert Transparenz von den Modellherstellern, Koordination zwischen Forschern und Unternehmen und neue Wege, diese Technologie in der realen Welt zu bewerten. Die Tech-Branche – und mit ihr die Weltwirtschaft – ruht auf dem Versprechen, dass KI transformativ sein wird. Aber das ist noch keine sichere Sache. Wenn Sie das nächste Mal kühne Behauptungen hören, denken Sie daran: Die meisten Unternehmen versuchen immer noch herauszufinden, was sie mit ihren Unterhosen anfangen sollen.