Microsoft dévoile sept nouveaux modèles d'IA à Build, dont un qui peut presque penser

Microsoft a lancé sa conférence annuelle des développeurs Build aujourd'hui avec un keynote, durant lequel l'entreprise a annoncé sept nouveaux modèles d'IA, dont son tout premier modèle de raisonnement. Pendant le keynote, Mustafa Suleyman, PDG de Microsoft AI, a réitéré le cadre de « superintelligence humaniste » du laboratoire en présentant les nouveaux modèles – ce qui est une façon élégante de dire qu'ils veulent que leur IA soit intelligente mais pas malveillante.

Le premier modèle de raisonnement de Microsoft AI, MAI-Thinking-1, a été entraîné sur des « données de qualité entreprise, propres et sous licence commerciale », a déclaré l'entreprise dans l'annonce du blog. Compte tenu des préoccupations croissantes (et des procès actifs) concernant le droit d'auteur et l'utilisation de l'IA, mentionner cela en premier sera important pour les clients de Microsoft, mais ce n'est pas la première entreprise à faire une telle promesse. Microsoft a déclaré que le modèle de 35 milliards de paramètres a battu Sonnet 4.61 d'Anthropic lorsqu'il a été évalué par des examinateurs indépendants dans un test en aveugle, et qu'il s'aligne avec Opus 4.6 d'Anthropic dans son score de référence SWE Bench Pro pour le codage. Dans la lignée de la frénésie agentique qui saisit tous les laboratoires d'IA en ce moment, MAI-Thinking-1 est conçu pour des tâches multi-étapes, et est disponible dans Microsoft Foundry en aperçu privé pour l'instant.

Rejoignant également la famille Microsoft AI (et la course globale pour construire le meilleur modèle de codage sur le marché) se trouve MAI-Code-1, que l'entreprise a décrit comme « ultra-efficace » et « réglé pour GitHub ». MAI-Code-1 arrive aujourd'hui sur Copilot et VS Code. MAI-Image-2.5, ainsi que son équivalent flash, est le premier modèle de Microsoft pour les tâches texte-à-image et image-à-image. Selon l'entreprise, il a surpassé Nano Banana Pro sur ELO, un système de notation adapté des échecs qui mesure le niveau relatif. Les modèles MAI-Image-2.5 sont en ligne maintenant dans PowerPoint et Foundry et sont déployés dans OneDrive. Comme Suleyman l'a annoncé pendant le keynote, il avait déjà atteint la troisième place sur le LM Arena Leaderboard, juste en dessous de Nano Banana.

MAI-Transcribe-1.5 « combine une précision de pointe dans 43 langues, avec un streaming à venir bientôt », a déclaré Microsoft. L'entreprise a également publié MAI-Voice-2 et son acolyte flash, qui prend en charge 15 langues de plus que son prédécesseur, MAI-Voice-1. Microsoft a publié les générations précédentes de ces modèles en aperçu il y a seulement deux mois, démontrant une fois de plus à quel point le cycle de lancement des nouveaux modèles d'IA est devenu rapide cette année.

« Tout est filigrané dès le départ », a souligné Suleyman à propos des cadres de sécurité des nouveaux modèles. Il a également mentionné des améliorations de l'efficacité des coûts pour chaque modèle, certaines allant jusqu'à 10 fois par rapport à des modèles concurrents similaires. Tous les nouveaux modèles MAI seront disponibles sur Fireworks AI, qui est maintenant généralement disponible sur Foundry, a déclaré l'entreprise, ainsi que sur Baseten et Open Router.

Suleyman a conclu son annonce de modèles d'IA en présentant une collaboration avec la Mayo Clinic pour développer un nouveau modèle de pointe pour les soins de santé. Le projet rejoint le nombre croissant d'applications d'IA spécifiques à la santé provenant d'entreprises comme OpenAI et Google. Microsoft propose déjà Copilot Health. Néanmoins, la confidentialité des données, la sécurité et les hallucinations restent des préoccupations en matière d'IA médicale – car rien ne dit « diagnostic fiable » comme un modèle qui invente parfois des choses.

Microsoft dévoile sept nouveaux modèles d'IA à Build, dont un qui peut presque penser

Les nouvelles dans votre boîte.