Китайская DeepSeek запустила V4: модель превзошла GPT-5 в бенчмарках кода

Новая архитектура Mixture-of-Experts с 1.2 трлн параметров показывает 96.4% на HumanEval — рекорд для открытых моделей

Алексей Громов2026-05-2214:326 минут чтения

Китайская лаборатория DeepSeek сегодня объявила о запуске четвёртого поколения своей флагманской языковой модели — DeepSeek-V4. Модель использует архитектуру Mixture-of-Experts с 1.2 триллиона параметров, из которых активны только 64 миллиарда на токен, что делает её одновременно мощной и эффективной.

На бенчмарке HumanEval модель показала 96.4% — это новый рекорд среди открытых моделей и на 2.1 процентных пункта выше, чем у GPT-5. В тесте MATH-500 результат составил 94.7%, а в MMLU-Pro — 82.3%. Все веса модели опубликованы под лицензией Apache 2.0.

«Мы верим, что открытый доступ к сильным моделям — единственный способ предотвратить монополизацию ИИ», — заявил CEO DeepSeek Лу Вэньфэн на презентации в Шэньчжэне. Модель уже доступна для скачивания на Hugging Face и через API провайдера.

Эксперты отмечают, что запуск DeepSeek-V4 продолжает тренд на демократизацию ИИ: стоимость инференса составляет $0.14 за миллион токенов — в 20 раз дешевле, чем у GPT-5.