金曜日、中国のAI企業DeepSeekが待望の新フラッグシップモデルV4のプレビューを公開した。特筆すべきは、前世代よりもはるかに長いプロンプトを処理できる点で、これは大量のテキストをより効率的に処理する新しい設計によるものだ。DeepSeekの以前のモデルと同様、V4はオープンソースであり、誰でもダウンロード、使用、改変が可能だ。
V4は、DeepSeekが2025年1月にリリースした推論モデルR1以来、最も重要なリリースとなる。限られた計算リソースで訓練されたR1は、その強力なパフォーマンスと効率性で世界のAI業界を驚かせ、DeepSeekを無名の研究チームから一夜にして中国で最も有名なAI企業に変えた。また、他の中国AI企業によるオープンウェイトモデルのリリースの波を引き起こす一因にもなった。