Китайский DeepSeek выпустил DeepSeek‑V4 с поддержкой 1 млн слов и снижением затрат

Китайский стартап DeepSeek представил новую модель искусственного интеллекта DeepSeek‑V4, отмечая её ключевые преимущества: возможность работы с входными данными длиной до 1 миллиона слов и заметное сокращение затрат на вычисления и оперативную память, на фоне обострившейся технологической конкуренции между Китаем и США.

Компания DeepSeek из Ханчжоу, получившая широкую известность после прошлогоднего так называемого «DeepSeek Shock», заявила на платформах WeChat и X, что DeepSeek‑V4 умеет обрабатывать экстремально длинные последовательности — до 1 млн слов. По словам разработчиков, это ставит модель в лидеры как среди национальных закрытых моделей, так и среди открытых проектов, позволяя ИИ анализировать огромные объёмы информации и точнее выполнять сложные команды.

Для разных задач DeepSeek выпустила две модификации. DeepSeek‑V4‑Pro — флагманский вариант с 1,6 трлн параметров, который по уровню возможностей почти не уступает Gemini‑Pro‑3.1 от Google и превосходит все существующие открытые модели. DeepSeek‑V4‑Flash — облегчённая и более дешёвая версия на 284 млрд параметров, ориентированная на быстрые и рентабельные внедрения для бизнеса и разработчиков.

По мнению Чжан И, основателя исследовательской компании iiMedia, запуск V4 может стать «переломным моментом» для отрасли. Он указывает, что сочетание высокой производительности и низких затрат решает проблему замедления и дороговизны обработки очень длинных запросов, что приближает передовые AI‑технологии к массовому коммерческому применению.

Появление DeepSeek‑V4 происходит на фоне обострившихся американо‑китайских отношений. Администрация США обвиняет структуры в Китае в попытках похищения американских AI‑технологий. Майкл Кратзиос, советник по науке и технике при экс‑президенте Дональде Трампе, заявил, что в США есть свидетельства использования китайскими группами техники «дистилляции» — промышленного извлечения знаний из чужих моделей для создания собственных, более дешёвых аналогов.

Успех DeepSeek в создании дешёвых, но эффективных моделей ставит в сложное положение крупные компании из Кремниевой долины, такие как Meta и Microsoft, которым приходится тратить огромные средства, чтобы оставаться конкурентоспособными. В частности, Meta недавно объявила о новом раунде сокращений персонала примерно на 10% для сохранения прибыли и перераспределения ресурсов на разработки в области ИИ.

При этом популярность DeepSeek внутри Китая, особенно в здравоохранении, финансовом секторе и органах местного управления, сочетается с опасениями по поводу приватности данных и цензуры. Критики указывают, что китайские модели ИИ часто уклоняются от ответов на политически чувствительные темы, что остаётся значимым ограничением при использовании таких систем в открытой среде.

Источник: AFP (перевод и адаптация).

Related Post