Microsoft inledde sin årliga Build-utvecklarkonferens idag med en keynote, under vilken företaget tillkännagav sju nya AI-modeller, inklusive sin allra första resonemangsmodell. Under keynoten upprepade Microsoft AI:s vd Mustafa Suleyman labbets "humanistisk superintelligens"-ramverk när han introducerade de nya modellerna – vilket är ett fint sätt att säga att de vill att deras AI ska vara smart men inte ond.
Microsoft AI:s första resonemangsmodell, MAI-Thinking-1, tränades på "företagsanpassad, ren och kommersiellt licensierade data", sa företaget i bloggmeddelandet. Med tanke på växande oro (och aktiva stämningar) kring upphovsrätt och AI-användning är det viktigt för Microsofts kunder att nämna detta först, men det är inte det första företaget som gör ett sådant löfte. Microsoft sa att den 35-miljarder-parameter stora modellen slog Anthropics Sonnet 4.61 när den utvärderades av oberoende granskare i ett blindtest, och att den ligger i linje med Anthropic Opus 4.6 i sitt SWE Bench Pro-benchmarkresultat för kodning. I linje med den agentiska galenskap som för närvarande griper alla AI-labb, är MAI-Thinking-1 designad för flerstegsuppgifter och finns tillgänglig i Microsoft Foundry i privat förhandsvisning för tillfället.
Även Microsoft AI-familjen (och den övergripande kapplöpningen att bygga den bästa kodningsmodellen på marknaden) ansluter sig MAI-Code-1, som företaget beskrev som "ultraeffektiv" och "inställd för GitHub." MAI-Code-1 kommer till Copilot och VS Code idag. MAI-Image-2.5, tillsammans med sin flash-ekvivalent, är Microsofts första modell för text-till-bild och bild-till-bild-uppgifter. Enligt företaget överträffade den Nano Banana Pro på ELO, ett betygssystem anpassat från schack som mäter relativ skicklighet. MAI-Image-2.5-modellerna är live nu i PowerPoint och Foundry och rullas ut i OneDrive. När Suleyman tillkännagav det under keynoten hade det redan nått tredje plats på LM Arena Leaderboard, precis under Nano Banana.
MAI-Transcribe-1.5 "kombinerar toppmodern noggrannhet över 43 språk, med streaming som kommer snart," sa Microsoft. Företaget släppte också MAI-Voice-2 och dess flash-sidekick, som kommer på 15 fler språk än sin föregångare, MAI-Voice-1. Microsoft släppte de tidigare generationerna av dessa modeller i förhandsvisning för bara två månader sedan, vilket återigen visar hur snabb lanseringscykeln för nya AI-modeller har blivit i år.
"Allt är vattenmärkt från grunden," betonade Suleyman om de nya modellernas säkerhetsramverk. Han nämnde också kostnadseffektivitetsförbättringar över varje modell, vissa så höga som 10x jämfört med liknande konkurrentmodeller. Alla nya MAI-modeller kommer att finnas tillgängliga på Fireworks AI, som nu är allmänt tillgängligt på Foundry, sa företaget, samt Baseten och Open Router.
Suleyman avslutade sitt AI-modellmeddelande med att introducera ett samarbete med Mayo Clinic för att utveckla en ny frontmodell för sjukvård. Projektet ansluter sig till det växande antalet hälso-specifika AI-applikationer från företag som OpenAI och Google. Microsoft erbjuder redan Copilot Health. Ändå är datasekretess, säkerhet och hallucinationer fortfarande problem när det gäller medicinsk AI – för inget säger "pålitlig diagnos" som en modell som ibland hittar på saker.