Die KI-Welt hat eine glänzende neue Obsession, und sie kommt in Form von drei Buchstaben: RSI. Nein, nicht Repetitive Strain Injury – obwohl die hektische Übernahme von Schlagwörtern in der Branche auch das verursachen könnte. Dieses RSI steht für Recursive Self-Improvement, das neueste Schlagwort, das Startups und Forscher gleichermaßen dazu bringt, einer Vision von KI nachzujagen, die sich ohne lästige menschliche Einmischung selbst verbessern kann.

Theoretisch ist RSI einfach: ein KI-System, das kontinuierlich seine eigenen Fähigkeiten verbessert und schließlich den Kreislauf schließt, sodass Menschen optional – oder schlimmer noch, überflüssig – werden. In der Praxis kann sich, wie schon bei AGI zuvor, niemand so recht einigen, was es eigentlich bedeutet oder wann es eintreffen könnte. Aber das hat den Hype-Zug nicht aufgehalten.

Anfang diesen Monats gründete der renommierte KI-Forscher Richard Socher ein Startup namens Recursive Superintelligence, dessen Hauptfokus darauf liegt, „wirklich rekursive, sich selbst verbessernde Superintelligenz im großen Maßstab“ zu bauen. Socher sagte TechCrunch, dass das Ziel darin besteht, „den gesamten Prozess der Ideenfindung, Umsetzung und Validierung von Forschungsideen“ zu automatisieren. Also im Grunde eine KI, die sich ihre eigenen Hausaufgaben ausdenken, sie machen und selbst benoten kann. Was könnte da schon schiefgehen?

Socher ist nicht allein. Alex Karpathy, ein Tesla- und OpenAI-Alumnus, der jetzt bei Anthropic arbeitet, hat an einem Projekt namens Auto-Research gearbeitet, bei dem Agentenschwärme eingesetzt werden, um LLMs mit einfachen Aufgaben zu trainieren. Bisher beschränkte sich seine Arbeit auf kleinere Verbesserungen an einem Modell im GPT-2-Maßstab – was, wie Karpathy selbst anmerkte, „(noch) keine neuartige, bahnbrechende ‚Forschung‘“ ist. Aber es reicht, um den Traum am Leben zu erhalten.

Adaption, gegründet von Cohere- und Google-Alumna Sara Hooker, hat kürzlich AutoScientist vorgestellt, ein Tool zur Automatisierung des Frontier-Trainings. Wie Karpathys System trainiert es Agenten, um schrittweise Verbesserungen vorzunehmen – jedoch mit dem großen Ehrgeiz, ein vollwertiges Frontier-Modell zu trainieren. Wenn das funktioniert, könnte das System schnell in etwas sehr RSI-ähnliches abgleiten.

Disarray-Gründerin Doris Xin wählte einen pragmatischeren Weg: Ihr selbsttrainierter Machine-Learning-Agent gewann 28 Medaillen bei einem aktuellen Kaggle-Wettbewerb und schlug damit viele menschlich trainierte Agenten. Xin argumentiert, dass wir bei unendlicher Rechenleistung und Zeit „bereits da sind“. Sie besteht darauf, dass es nicht um Kreativität geht, sondern nur um „hausbackene Ingenieursarbeit“.

Aber es gibt Hinweise darauf, dass die Branche nicht so nah dran ist, wie der Hype vermuten lässt. Google-CEO Sundar Pichai gab kürzlich zu: „Wir sind noch nicht ganz so weit“, und beschrieb RSI als „eine nächste Stufe der Beschleunigung mit vielen Implikationen“. In der Zwischenzeit schreibt das Claude Code-Tool von Anthropic Berichten zufolge fast 100 % des eigenen Team-Codes. Eine aktuelle Umfrage ergab, dass fünf von 18 Anthropic-Ingenieuren glaubten, dass Mythos bald einen L4-Ingenieur ersetzen könnte – einen Programmierer auf mittlerem Niveau. Der Bericht stellte jedoch Schwächen in der Selbststeuerung fest, darunter „selbstständiges Managen von einwöchigen, mehrdeutigen Aufgaben, Verständnis von Organisationsprioritäten, Geschmack, Verifikation, Befolgung von Anweisungen und Epistemik“. Mit anderen Worten: alles, was RSI tatsächlich zum Funktionieren bringt.

Das Center for Security and Emerging Technology in Georgetown versammelte letztes Jahr Experten und stellte eine große Spaltung fest: Einige erwarteten eine unmittelbare „Superintelligenz“-Explosion, andere langsameren Fortschritt und ein Plateau. Helen Toner, CSET-Direktorin und ehemaliges OpenAI-Vorstandsmitglied, stellte klar, dass die Nutzung von KI-Tools für die Forschung nicht als RSI gilt. „Sie nutzen KI einfach so viel wie möglich“, sagte sie. „RSI bedeutet wirklich, dass keine Menschen mehr nötig sind.“

METRs Ayeja Cotra legte Meilensteine fest: „Angemessenheit“ (KI kann ohne Menschen forschen, wenn auch schlecht), „Parität“ (KI erreicht menschliches Niveau) und „Überlegenheit“ (KI übertrifft menschliche KI-Zusammenarbeit). Sie glaubt, dass Angemessenheit innerhalb von ein paar Jahren eintreffen könnte, aber Parität ist unklarer. Sobald Parität erreicht ist, sagt sie Überlegenheit innerhalb eines weiteren Jahres voraus.

Toner zieht einen historischen Vergleich: „Wir gingen von Maschinensprache zu Assemblersprache und kompilierten Sprachen; man entfernt sich weiter vom Kern des Computers. Aber der Mensch hat immer noch, in einem intuitiven Sinne, die Kontrolle.“ Über dieses Paradigma hinauszugehen, erfordert die Lösung von