Microsoft presenta sette nuovi modelli AI al Build, incluso uno che può pensare (più o meno)

Microsoft ha dato il via oggi alla sua conferenza annuale per sviluppatori Build con un keynote, durante il quale l'azienda ha annunciato sette nuovi modelli AI, incluso il suo primo modello di ragionamento. Durante il keynote, il CEO di Microsoft AI Mustafa Suleyman ha ribadito la cornice di "superintelligenza umanista" del laboratorio presentando i nuovi modelli - un modo elegante per dire che vogliono che la loro IA sia intelligente ma non malvagia.

Il primo modello di ragionamento di Microsoft AI, MAI-Thinking-1, è stato addestrato su "dati di livello enterprise, puliti e con licenza commerciale", ha detto l'azienda nell'annuncio sul blog. Date le crescenti preoccupazioni (e le cause attive) sul diritto d'autore e l'uso dell'IA, sottolinearlo fin dall'inizio sarà importante per i clienti di Microsoft, ma non è la prima azienda a fare una tale promessa. Microsoft ha affermato che il modello da 35 miliardi di parametri ha superato Sonnet 4.61 di Anthropic quando valutato da revisori indipendenti in un test alla cieca, e che si allinea con Opus 4.6 di Anthropic nel punteggio del benchmark SWE Bench Pro per la programmazione. In linea con la mania agentica che sta contagiando tutti i laboratori di IA al momento, MAI-Thinking-1 è progettato per compiti multi-step ed è disponibile in Microsoft Foundry in anteprima privata per ora.

A unirsi alla famiglia Microsoft AI (e alla corsa generale per costruire il miglior modello di programmazione sul mercato) è anche MAI-Code-1, che l'azienda ha descritto come "ultra-efficiente" e "ottimizzato per GitHub". MAI-Code-1 arriverà oggi su Copilot e VS Code. MAI-Image-2.5, insieme alla sua versione flash, è il primo modello di Microsoft per compiti text-to-image e image-to-image. Secondo l'azienda, ha superato Nano Banana Pro su ELO, un sistema di valutazione adattato dagli scacchi che misura l'abilità relativa. I modelli MAI-Image-2.5 sono ora attivi in PowerPoint e Foundry e sono in fase di distribuzione in OneDrive. Come annunciato da Suleyman durante il keynote, aveva già raggiunto il terzo posto nella classifica LM Arena, appena sotto Nano Banana.

MAI-Transcribe-1.5 "combina accuratezza all'avanguardia in 43 lingue, con streaming in arrivo", ha detto Microsoft. L'azienda ha anche rilasciato MAI-Voice-2 e il suo sidekick flash, che arriva in 15 lingue in più rispetto al suo predecessore, MAI-Voice-1. Microsoft ha rilasciato le generazioni precedenti di questi modelli in anteprima solo due mesi fa, dimostrando ancora una volta quanto sia rapido il ciclo di lancio per i nuovi modelli AI quest'anno.

"Tutto è filigranato fin dall'inizio", ha sottolineato Suleyman riguardo ai framework di sicurezza dei nuovi modelli. Ha anche menzionato miglioramenti nell'efficienza dei costi per ogni modello, alcuni fino a 10x rispetto a modelli concorrenti simili. Tutti i nuovi modelli MAI saranno disponibili su Fireworks AI, che ora è generalmente disponibile su Foundry, ha detto l'azienda, così come su Baseten e Open Router.

Suleyman ha concluso l'annuncio dei modelli AI introducendo una collaborazione con la Mayo Clinic per sviluppare un nuovo modello all'avanguardia per la sanità. Il progetto si unisce al crescente numero di applicazioni AI specifiche per la salute di aziende tra cui OpenAI e Google. Microsoft offre già Copilot Health. Tuttavia, la privacy dei dati, la sicurezza e le allucinazioni sono ancora preoccupazioni quando si tratta di IA medica - perché niente dice "diagnosi affidabile" come un modello che occasionalmente si inventa le cose.

Microsoft presenta sette nuovi modelli AI al Build, incluso uno che può pensare (più o meno)

Notizie nella tua casella.