마이크로소프트가 연례 개발자 컨퍼런스 빌드(Build) 기조연설에서 7개의 새 AI 모델을 발표했습니다. 그중에는 최초의 추론 모델도 포함되어 있죠. 기조연설에서 마이크로소프트 AI CEO 무스타파 술레이만은 새 모델들을 소개하면서 연구소의 '인본주의적 초지능' 프레임을 다시 강조했는데, 이는 AI를 똑똑하지만 사악하지 않게 만들겠다는 뜻의 멋진 표현입니다.
마이크로소프트 AI의 첫 번째 추론 모델인 MAI-Thinking-1은 '기업용, 깨끗하고 상업적으로 라이선스된 데이터'로 훈련되었다고 회사는 블로그 발표에서 밝혔습니다. 저작권과 AI 사용에 대한 우려(그리고 활발한 소송)가 커지는 상황에서 이를 최우선으로 언급한 것은 마이크로소프트 고객에게 중요하겠지만, 이런 약속을 한 첫 번째 회사는 아닙니다. 마이크로소프트는 350억 파라미터 모델이 맹검 테스트에서 독립 평가자들에 의해 Anthropic의 Sonnet 4.61을 이겼으며, SWE Bench Pro 벤치마크 점수에서 Anthropic Opus 4.6과 일치한다고 밝혔습니다. 현재 모든 AI 연구소를 사로잡은 에이전트 열풍에 맞춰 MAI-Thinking-1은 다단계 작업을 위해 설계되었으며, 현재 Microsoft Foundry에서 비공개 미리보기로 제공됩니다.
또한 마이크로소프트 AI 제품군(그리고 최고의 코딩 모델을 만들기 위한 전반적인 경쟁)에 합류한 것은 MAI-Code-1으로, 회사는 이를 '초효율적'이고 'GitHub에 최적화'되었다고 설명했습니다. MAI-Code-1은 오늘부터 Copilot과 VS Code에 제공됩니다. MAI-Image-2.5와 그 플래시 버전은 텍스트-이미지 및 이미지-이미지 작업을 위한 마이크로소프트의 첫 번째 모델입니다. 회사에 따르면, 체스에서 차용한 상대적 기술을 측정하는 ELO 등급에서 Nano Banana Pro를 능가했습니다. MAI-Image-2.5 모델은 현재 PowerPoint와 Foundry에서 사용 가능하며 OneDrive에 출시 중입니다. 술레이만이 기조연설에서 발표했을 때, 이미 LM Arena 리더보드에서 Nano Banana 바로 아래 3위를 차지했습니다.
MAI-Transcribe-1.5는 '43개 언어에 걸쳐 최첨단 정확도를 결합하며, 스트리밍이 곧 제공될 예정'이라고 마이크로소프트는 말했습니다. 회사는 또한 MAI-Voice-2와 그 플래시 버전을 출시했는데, 이전 버전인 MAI-Voice-1보다 15개 더 많은 언어를 지원합니다. 마이크로소프트는 불과 두 달 전에 이러한 모델의 이전 세대를 미리보기로 출시했으며, 이는 올해 새 AI 모델의 출시 주기가 얼마나 빨라졌는지를 다시 한 번 보여줍니다.
'모든 것은 처음부터 워터마킹됩니다'라고 술레이만은 새 모델의 보안 프레임워크에 대해 강조했습니다. 그는 또한 각 모델의 비용 효율성 개선을 언급했으며, 일부는 유사한 경쟁사 모델에 비해 최대 10배까지 높다고 말했습니다. 모든 새 MAI 모델은 Fireworks AI에서 사용할 수 있으며, 이제 Foundry에서 일반 공급된다고 회사는 밝혔습니다. 또한 Baseten과 Open Router에서도 사용할 수 있습니다.
술레이만은 AI 모델 발표를 마무리하며 메이요 클리닉과의 협력을 소개하여 의료 분야의 새로운 프론티어 모델을 개발한다고 밝혔습니다. 이 프로젝트는 OpenAI와 Google을 포함한 회사들의 증가하는 건강 특화 AI 애플리케이션에 합류합니다. 마이크로소프트는 이미 Copilot Health를 제공하고 있습니다. 그럼에도 불구하고 데이터 프라이버시, 보안, 환각은 의료 AI와 관련된 우려 사항입니다. 가끔 무언가를 지어내는 모델로 '신뢰할 수 있는 진단'을 한다는 것은 정말 아이러니하죠.