微软今天在年度Build开发者大会的主题演讲中,发布了七款新AI模型,包括其首个推理模型。主题演讲中,微软AI CEO Mustafa Suleyman在介绍新模型时,再次强调了实验室的“人文主义超级智能”框架——说白了就是希望AI聪明但不邪恶。

微软AI的首个推理模型MAI-Thinking-1,据公司博客称,是在“企业级、干净且商业许可的数据”上训练的。鉴于对版权和AI使用的日益担忧(以及活跃的诉讼),提前强调这一点对微软客户很重要,但微软并非首家做出此类承诺的公司。微软表示,这款350亿参数的模型在独立评审的盲测中击败了Anthropic的Sonnet 4.61,并在SWE Bench Pro基准测试中与Anthropic Opus 4.6持平。为了迎合当前AI实验室的代理狂热,MAI-Thinking-1专为多步骤任务设计,目前已在Microsoft Foundry中提供私人预览。

加入微软AI家族(以及争夺最佳编程模型竞赛)的还有MAI-Code-1,公司称其“超高效”且“为GitHub调优”。MAI-Code-1今天将登陆Copilot和VS Code。MAI-Image-2.5及其闪速版是微软首个用于文生图和图生图任务的模型。据公司称,它在ELO评分(一种源自国际象棋的相对技能衡量系统)上超越了Nano Banana Pro。MAI-Image-2.5模型现已上线PowerPoint和Foundry,并正在OneDrive中推出。Suleyman在主题演讲中宣布时,它已登上LM Arena排行榜第三位,仅次于Nano Banana。

MAI-Transcribe-1.5“结合了43种语言的顶尖准确率,流式传输即将推出”,微软表示。公司还发布了MAI-Voice-2及其闪速版,比前代MAI-Voice-1多支持15种语言。微软仅在两个月前发布了这些模型的早期版本预览,再次证明了今年新AI模型发布周期的快速。

“所有内容从一开始就带有水印,”Suleyman强调新模型的安全框架。他还提到每个模型的成本效率提升,有些比竞争对手模型高出10倍。所有新MAI模型将在Fireworks AI上提供,该平台现已普遍可用,此外还有Baseten和Open Router。

Suleyman以与梅奥诊所合作开发医疗领域前沿模型结束了AI模型发布。该项目加入了包括OpenAI和Google在内的公司日益增多的医疗特定AI应用。微软已提供Copilot Health。然而,数据隐私、安全和幻觉仍是医疗AI的担忧——因为没有什么比一个偶尔编造东西的模型更能体现“可信诊断”了。