Microsoft bringt sieben neue KI-Modelle auf die Build, darunter eines, das irgendwie denken kann

Microsoft hat seine jährliche Build-Entwicklerkonferenz heute mit einer Keynote eröffnet, in der das Unternehmen sieben neue KI-Modelle ankündigte, darunter sein allererstes Reasoning-Modell. Während der Keynote wiederholte Microsoft-KI-CEO Mustafa Suleyman den "humanistischen Superintelligenz"-Rahmen des Labors bei der Vorstellung der neuen Modelle – eine schicke Art zu sagen, dass sie wollen, dass ihre KI klug, aber nicht böse ist.

Microsoft KIs erstes Reasoning-Modell, MAI-Thinking-1, wurde laut Unternehmensankündigung im Blog auf "unternehmensgerechten, sauberen und kommerziell lizenzierten Daten" trainiert. Angesichts wachsender Bedenken (und aktiver Klagen) bezüglich Urheberrecht und KI-Nutzung ist es für Microsofts Kunden wichtig, dies gleich zu Beginn zu erwähnen, aber es ist nicht das erste Unternehmen, das ein solches Versprechen macht. Microsoft sagte, dass das 35-Milliarden-Parameter-Modell Anthropics Sonnet 4.61 schlug, wenn es von unabhängigen Prüfern in einem Blindtest bewertet wurde, und dass es mit Anthropic Opus 4.6 in seinem SWE Bench Pro Benchmark-Score für Codierung übereinstimmt. Im Einklang mit dem agentischen Hype, der derzeit alle KI-Labore erfasst hat, ist MAI-Thinking-1 für mehrstufige Aufgaben ausgelegt und vorerst in privater Vorschau in Microsoft Foundry verfügbar.

Ebenfalls in die Microsoft-KI-Familie (und das allgemeine Rennen um das beste Codierungsmodell auf dem Markt) aufgenommen wird MAI-Code-1, das das Unternehmen als "ultra-effizient" und "für GitHub optimiert" beschrieb. MAI-Code-1 kommt heute zu Copilot und VS Code. MAI-Image-2.5, zusammen mit seinem Flash-Äquivalent, ist Microsofts erstes Modell für Text-zu-Bild- und Bild-zu-Bild-Aufgaben. Laut Unternehmen übertraf es Nano Banana Pro auf ELO, einem vom Schach adaptierten Bewertungssystem, das relative Fähigkeiten misst. Die MAI-Image-2.5-Modelle sind jetzt in PowerPoint und Foundry live und werden in OneDrive ausgerollt. Als Suleyman es während der Keynote ankündigte, hatte es bereits den dritten Platz auf der LM Arena Leaderboard erreicht, knapp unter Nano Banana.

MAI-Transcribe-1.5 "vereint hochmoderne Genauigkeit in 43 Sprachen, mit Streaming in Kürze", sagte Microsoft. Das Unternehmen veröffentlichte auch MAI-Voice-2 und seinen Flash-Seitenkick, der in 15 weiteren Sprachen als sein Vorgänger MAI-Voice-1 erhältlich ist. Microsoft hatte die früheren Generationen dieser Modelle erst vor zwei Monaten in der Vorschau veröffentlicht, was erneut zeigt, wie schnell der Veröffentlichungszyklus für neue KI-Modelle in diesem Jahr geworden ist.

"Alles ist von Grund auf mit Wasserzeichen versehen", betonte Suleyman hinsichtlich der Sicherheitsrahmen der neuen Modelle. Er erwähnte auch Kosteneffizienzverbesserungen bei jedem Modell, einige bis zu 10x im Vergleich zu ähnlichen Konkurrenzmodellen. Alle neuen MAI-Modelle werden auf Fireworks AI verfügbar sein, das jetzt allgemein auf Foundry verfügbar ist, so das Unternehmen, sowie auf Baseten und Open Router.

Suleyman schloss seine KI-Modellankündigung mit der Vorstellung einer Zusammenarbeit mit der Mayo Clinic zur Entwicklung eines neuen Grenzmodells für das Gesundheitswesen ab. Das Projekt reiht sich in die wachsende Zahl gesundheitsspezifischer KI-Anwendungen von Unternehmen wie OpenAI und Google ein. Microsoft bietet bereits Copilot Health an. Dennoch sind Datenschutz, Sicherheit und Halluzinationen immer noch Bedenken, wenn es um medizinische KI geht – denn nichts sagt "vertrauenswürdige Diagnose" wie ein Modell, das gelegentlich Dinge erfindet.

Microsoft bringt sieben neue KI-Modelle auf die Build, darunter eines, das irgendwie denken kann

Nachrichten in deinem Posteingang.