В пятницу китайская AI-компания DeepSeek выпустила предварительную версию V4, своей долгожданной новой флагманской модели. Примечательно, что модель может обрабатывать гораздо более длинные запросы, чем предыдущее поколение, благодаря новой конструкции, которая помогает ей более эффективно обрабатывать большие объемы текста. Как и предыдущие модели DeepSeek, V4 является открытым исходным кодом, то есть любой желающий может скачать, использовать и модифицировать ее.

V4 знаменует собой самый значительный релиз DeepSeek с момента R1, модели рассуждений, запущенной в январе 2025 года. R1, обученная на ограниченных вычислительных ресурсах, поразила мировую AI-индустрию своей высокой производительностью и эффективностью, превратив DeepSeek из малоизвестной исследовательской группы в самую известную AI-компанию Китая практически за одну ночь. Это также помогло запустить волну релизов моделей с открытым весом от других китайских AI-компаний.