マイクロソフトは本日、年次開発者会議Buildの基調講演を開始し、その中で7つの新しいAIモデルを発表しました。これには同社初の推論モデルも含まれています。基調講演で、マイクロソフトAIのCEOムスタファ・スレイマンは、新しいモデルを紹介する際に、研究所の「人間主義的超知能」という枠組みを繰り返し述べました。これは、AIを賢くするが邪悪にはしないという、凝った言い方です。
マイクロソフトAI初の推論モデル「MAI-Thinking-1」は、「エンタープライズグレードでクリーンかつ商用ライセンスされたデータ」でトレーニングされたと、同社はブログ発表で述べています。著作権とAIの使用に関する懸念(および活発な訴訟)が高まる中、これを最初に強調することはマイクロソフトの顧客にとって重要ですが、同社がこのような約束をした最初の企業ではありません。マイクロソフトは、350億パラメータのこのモデルが、独立したレビュアーによるブラインドテストでAnthropicのSonnet 4.61を上回り、SWE Bench ProベンチマークスコアでAnthropic Opus 4.6に匹敵すると述べています。現在すべてのAI研究所を席巻しているエージェントブームに合わせて、MAI-Thinking-1はマルチステップタスク向けに設計されており、現在Microsoft Foundryでプライベートプレビューとして利用可能です。
また、マイクロソフトAIファミリーに加わる(そして市場でトップのコーディングモデルを構築する全体的な競争に参加する)のは「MAI-Code-1」で、同社はこれを「超効率的」で「GitHub向けに調整されている」と説明しています。MAI-Code-1は本日、CopilotとVS Codeに登場します。「MAI-Image-2.5」とそのフラッシュ版は、テキストから画像、画像から画像へのタスク向けのマイクロソフト初のモデルです。同社によると、チェスから適応された相対的なスキルを測定するレーティングシステムELOで、Nano Banana Proを上回りました。MAI-Image-2.5モデルは現在PowerPointとFoundryで利用可能で、OneDriveにも展開されています。スレイマンが基調講演で発表した時点で、すでにLM Arena LeaderboardでNano Bananaのすぐ下の3位にランクインしていました。
「MAI-Transcribe-1.5」は、「43言語にわたる最先端の精度と、近日公開予定のストリーミングを組み合わせている」とマイクロソフトは述べています。同社はまた、「MAI-Voice-2」とそのフラッシュ版をリリースしました。これは前世代のMAI-Voice-1よりも15言語多いです。マイクロソフトはこれらのモデルの初期世代をわずか2か月前にプレビューでリリースしており、今年の新しいAIモデルのリリースサイクルがいかに急速になっているかを再び示しています。
「すべては最初から透かしが入れられている」とスレイマンは新しいモデルのセキュリティフレームワークについて強調しました。また、各モデルのコスト効率の改善についても言及し、一部は競合他社の類似モデルと比較して最大10倍の改善があると述べました。新しいMAIモデルはすべて、Fireworks AIで利用可能になり、Foundryで一般提供が開始され、BasetenやOpen Routerでも利用可能になると同社は述べています。
スレイマンはAIモデルの発表を締めくくり、メイヨー・クリニックとの協業を発表し、医療向けの新しいフロンティアモデルを開発することを明らかにしました。このプロジェクトは、OpenAIやGoogleを含む企業からの健康特化型AIアプリケーションの増加に加わります。マイクロソフトはすでにCopilot Healthを提供しています。それでも、医療AIに関してはデータプライバシー、セキュリティ、幻覚が依然として懸念事項です。なぜなら、時々物をでっち上げるモデルほど「信頼できる診断」を意味するものはないからです。