DeepSeek V4 是深度求索推出的开源大模型,2026 年 4 月发布 V4-Pro 和 V4-Flash 两个版本。
混合注意力架构(CSA + HCA),1M+ 上下文,MIT 开源可私有化部署。
高并发线上服务、预算敏感、私有化部署、中文场景、竞赛编程
品牌归属
深度求索 (DeepSeek)
最新版本
DeepSeek V4-Pro / V4-Flash(2026年4月)
发布日期
2026-04-24
模型定位
国产开源之光,MIT 开源 + 极致性价比(仅为 GPT 的 1/400),私有化部署首选
上下文窗口
1M+ token
多模态支持
文本
代码能力
Codeforces Elo 3,206,竞赛编程能力强;SWE-bench Pro 55.4%
长文本处理
1M+ token 上下文,混合注意力架构(CSA+HCA)长上下文效率最高
推理速度
V4-Flash 输出仅 $0.07/M token,极致低价
关键基准
优势
不足
2026年4月连续发布 V4-Pro 和 V4-Flash。V4-Pro 1.6T/49B MoE,混合注意力架构,MIT 开源。V4-Flash 输出仅 $0.07/M token,是 GPT-5.5 的 1/400。开源一周全球下载量突破百万次。
暂无评价,成为第一个评价的人