Microsoft rozpoczął dziś swoją doroczną konferencję deweloperską Build keynote, podczas której ogłosił siedem nowych modeli AI, w tym swój pierwszy model rozumowania. Podczas keynote, dyrektor generalny Microsoft AI, Mustafa Suleyman, powtórzył ramy "humanistycznej superinteligencji" laboratorium przy przedstawianiu nowych modeli - co jest wymyślnym sposobem na powiedzenie, że chcą, aby ich AI było mądre, ale nie złe.
Pierwszy model rozumowania Microsoft AI, MAI-Thinking-1, został wytrenowany na "danych klasy korporacyjnej, czystych i dostępnych komercyjnie", jak podała firma w ogłoszeniu na blogu. Biorąc pod uwagę rosnące obawy (i aktywne pozwy) dotyczące praw autorskich i wykorzystania AI, podkreślenie tego na początku będzie ważne dla klientów Microsoftu, ale nie jest to pierwsza firma, która składa taką obietnicę. Microsoft stwierdził, że model o 35 miliardach parametrów pokonał Sonnet 4.61 Anthropica w ocenie niezależnych recenzentów w ślepym teście, a także dorównuje Opus 4.6 Anthropica w benchmarku SWE Bench Pro dla kodowania. Zgodnie z szałem agentowym, który ogarnął wszystkie laboratoria AI, MAI-Thinking-1 jest zaprojektowany do zadań wieloetapowych i jest dostępny w Microsoft Foundry w prywatnym podglądzie na razie.
Do rodziny Microsoft AI (i ogólnego wyścigu o zbudowanie najlepszego modelu kodowania na rynku) dołącza również MAI-Code-1, który firma opisała jako "ultrawydajny" i "dostrojony do GitHub". MAI-Code-1 trafia dziś do Copilot i VS Code. MAI-Image-2.5, wraz z jego flashowym odpowiednikiem, to pierwszy model Microsoftu do zadań tekst-obraz i obraz-obraz. Według firmy, przewyższył Nano Banana Pro w ELO, systemie ratingowym zaadaptowanym z szachów, który mierzy względne umiejętności. Modele MAI-Image-2.5 są już dostępne w PowerPoint i Foundry, a także wdrażane w OneDrive. Jak ogłosił Suleyman podczas keynote, model zajął już trzecie miejsce na LM Arena Leaderboard, tuż pod Nano Banana.
MAI-Transcribe-1.5 "łączy najnowocześniejszą dokładność w 43 językach, z transmisją strumieniową wkrótce", powiedział Microsoft. Firma wydała również MAI-Voice-2 i jego flashowego pomocnika, który obsługuje 15 języków więcej niż jego poprzednik, MAI-Voice-1. Microsoft wydał wcześniejsze generacje tych modeli w podglądzie zaledwie dwa miesiące temu, co pokazuje, jak szybki stał się cykl wydawniczy nowych modeli AI w tym roku.
"Wszystko jest znakowane wodą od podstaw", podkreślił Suleyman w kontekście ram bezpieczeństwa nowych modeli. Wspomniał również o poprawie efektywności kosztowej w każdym modelu, niektóre nawet 10-krotnie w porównaniu do podobnych modeli konkurencji. Wszystkie nowe modele MAI będą dostępne na Fireworks AI, które jest teraz ogólnie dostępne na Foundry, jak podała firma, a także na Baseten i Open Router.
Suleyman zakończył ogłoszenie modeli AI, przedstawiając współpracę z Mayo Clinic w celu opracowania nowego modelu granicznego dla opieki zdrowotnej. Projekt dołącza do rosnącej liczby aplikacji AI specyficznych dla zdrowia od firm takich jak OpenAI i Google. Microsoft oferuje już Copilot Health. Mimo to, prywatność danych, bezpieczeństwo i halucynacje wciąż są problemami w przypadku medycznego AI - bo nic tak nie mówi "godna zaufania diagnoza" jak model, który od czasu do czasu coś wymyśla.