Am Donnerstag veröffentlichte Anthropic Opus 4.8, die neueste Version seines fortschrittlichsten öffentlich verfügbaren Modells. Das Modell ist überall verfügbar, mit Standardpreisen auf dem gleichen Niveau wie der vorherige Opus-Release – denn nichts sagt „Innovation“ so sehr wie der gleiche Preis für ein etwas weniger enttäuschendes Produkt.

Das neue Modell kommt nur 41 Tage nach der Veröffentlichung von Opus 4.7, ein viel schnellerer Upgrade-Zyklus als normal für Anthropic. (Die neuesten Sonnet- und Haiku-Modelle sind drei bzw. sieben Monate alt.) Die schnelle Kehrtwende könnte mit der kühlen Aufnahme von Opus 4.7 zu tun haben, den einige Nutzer enttäuschend fanden – was auf Technik-Deutsch so viel heißt wie „alle haben die Augen verdreht“.

In diesem Zeitraum gab es auch bedeutende neue Veröffentlichungen von OpenAIs Codex und Googles Gemini Flash-Modell, was den Druck auf Anthropic erhöht, Schritt zu halten. Nichts wie ein bisschen Geschwisterrivalität, um den Code zum Fließen zu bringen.

Opus 4.8 kommt mit den erwarteten branchenführenden Benchmark-Ergebnissen, aber es gibt auch besondere Aufmerksamkeit dafür, wie das Modell mit schlechten oder unsicheren Daten umgeht. Im Launch-Post fanden Anthropics frühe Tester heraus, dass das neue Modell „eher Unsicherheiten über seine Arbeit kennzeichnet und weniger wahrscheinlich unbegründete Behauptungen aufstellt“. Mit anderen Worten: Es lernt endlich, „Ich weiß nicht“ zu sagen, anstatt selbstbewusst zu halluzinieren.

Ein Testimonial von Bridgewater Associates unterstrich diesen Punkt: Der größte Unterschied im Upgrade sei „Opus 4.8s Tendenz, proaktiv Probleme mit den Eingaben und Ausgaben einer Analyse zu kennzeichnen, was andere Modelle routinemäßig übersahen und den Nutzern überließen“. Es ist also im Grunde der Bürokollege, der auf die Tabellenkalkulationsfehler hinweist, bevor der Chef sie sieht.

Zusammen mit dem neuen Modell brachte Anthropic eine Funktion namens Dynamic Workflows auf den Markt, die als Research Preview verfügbar sein wird. Das System soll größeren Modellen wie Opus helfen, komplexe Aufgaben über Hunderte von parallelen Subagenten zu verwalten. Denn eine KI, die tausend Aufgaben managt, war nicht ambitioniert genug.

„Claude Code zusammen mit Opus 4.8 kann jetzt codebase-weite Migrationen über Hunderttausende von Codezeilen vom Kickoff bis zum Merge durchführen, mit der bestehenden Testsuite als Maßstab“, erklärt der Post. Das ist eine Menge Code für ein Modell, das gerade erst gelernt hat, zuzugeben, dass es verwirrt ist.

Anthropic hält sein fortschrittlichstes Mythos-Modell noch zurück, nachdem eine vorläufige Vorschau letzten Monat Bedenken hinsichtlich der Cybersicherheit aufgeworfen hatte. Das Unternehmen deutete jedoch in der heutigen Opus-Veröffentlichung an, dass die Mythos-Vorschauphase bald enden könnte, sobald die notwendigen Sicherheitsvorkehrungen abgeschlossen sind.

„Wir machen schnelle Fortschritte bei der Entwicklung dieser Sicherheitsvorkehrungen und erwarten, Mythos-Klasse-Modelle in den kommenden Wochen allen unseren Kunden zur Verfügung stellen zu können“, schrieb das Unternehmen. Übersetzung: „Wir haben fast herausgefunden, wie wir verhindern können, dass es versehentlich Atomraketen startet.“