Китайская лаборатория DeepSeek сегодня объявила о запуске четвёртого поколения своей флагманской языковой модели — DeepSeek-V4. Модель использует архитектуру Mixture-of-Experts с 1.2 триллиона параметров, из которых активны только 64 миллиарда на токен, что делает её одновременно мощной и эффективной.
На бенчмарке HumanEval модель показала 96.4% — это новый рекорд среди открытых моделей и на 2.1 процентных пункта выше, чем у GPT-5. В тесте MATH-500 результат составил 94.7%, а в MMLU-Pro — 82.3%. Все веса модели опубликованы под лицензией Apache 2.0.
«Мы верим, что открытый доступ к сильным моделям — единственный способ предотвратить монополизацию ИИ», — заявил CEO DeepSeek Лу Вэньфэн на презентации в Шэньчжэне. Модель уже доступна для скачивания на Hugging Face и через API провайдера.
Эксперты отмечают, что запуск DeepSeek-V4 продолжает тренд на демократизацию ИИ: стоимость инференса составляет $0.14 за миллион токенов — в 20 раз дешевле, чем у GPT-5.