DeepSeek V4

深度求索 (DeepSeek)

国产开源之光，V4-Pro MIT 开源，极致性价比仅为 GPT 的 1/400

★★★★4.2 (5 评价)

对话代码

价格方案

免费版

免费

V4-Flash
Web/App

V4-Flash API

$0.04/$0.07 per 1M token

1M 上下文
极致低价

V4-Pro API

$0.435/$0.87 per 1M token

49B 活跃参数
更强推理

开源

MIT 免费

自部署
1.6T 权重下载

DeepSeek V4 是深度求索推出的开源大模型，2026 年 4 月发布 V4-Pro 和 V4-Flash 两个版本。

最新版本：DeepSeek V4-Pro / V4-Flash（2026 年 4 月）

混合注意力架构（CSA + HCA），1M+ 上下文，MIT 开源可私有化部署。

核心能力

极致性价比：V4-Flash 仅 $0.07/M token 输出（GPT-5.5 的 1/400）
MIT 开源：1.6T/49B MoE，可下载权重自部署
混合注意力：CSA + HCA 架构，长上下文效率最高
Codeforces Elo 3,206：竞赛编程能力强
1M+ Token 上下文：长文本处理出色

适用场景

高并发线上服务、预算敏感、私有化部署、中文场景、竞赛编程

👍 优点

极致性价比，API 仅 GPT 1/400
MIT 开源可私有化部署
1M+ 超长上下文
竞赛编程能力强
中文场景优化

👎 缺点

SWE-bench Pro（防污染）仅 55.4%
Agent 稳定性不如 Claude
海外部署节点少
多模态能力有限

模型详情

基础信息

品牌归属

深度求索 (DeepSeek)

核心性能

上下文窗口

1M+ token

多模态支持

文本

代码能力

Codeforces Elo 3,206，竞赛编程能力强；SWE-bench Pro 55.4%

长文本处理

1M+ token 上下文，混合注意力架构（CSA+HCA）长上下文效率最高

推理速度

V4-Flash 输出仅 $0.07/M token，极致低价

关键基准

◆Codeforces Elo: 3,206
◆V4-Flash 价格: $0.04/$0.07 per 1M token（GPT-5.5 的 1/400）
◆V4-Pro: 1.6T/49B MoE，MIT 开源
◆1M+ 上下文，混合注意力架构 CSA+HCA

优势与不足

优势

+极致性价比，API 仅为 GPT-5.5 的 1/400
+MIT 开源可私有化部署，文档清晰
+1M+ 超长上下文，混合注意力架构效率最高
+竞赛编程能力强（Codeforces Elo 3,206）
+中文场景深度优化

不足

−SWE-bench Pro（防污染）仅 55.4%，Agent 稳定性不如 Claude
−海外部署节点少
−多模态能力有限
−Agent 长链任务有时会断

适用场景

高并发线上服务（极致低成本）预算敏感型项目私有化部署与自托管中文场景与竞赛编程

更新动态

2026年4月连续发布 V4-Pro 和 V4-Flash。V4-Pro 1.6T/49B MoE，混合注意力架构，MIT 开源。V4-Flash 输出仅 $0.07/M token，是 GPT-5.5 的 1/400。开源一周全球下载量突破百万次。

更新动态

2026年5月5日

DeepSeek V4 开源冲击波：全球下载量一周破百万

2026年4月24日

DeepSeek 发布 V4 系列：MIT 开源，API 仅为 GPT 的 1/400

用户评价

暂无评价，成为第一个评价的人

模型详情

基础信息

品牌归属

深度求索 (DeepSeek)

核心性能

上下文窗口

1M+ token

多模态支持

文本

代码能力

Codeforces Elo 3,206，竞赛编程能力强；SWE-bench Pro 55.4%

长文本处理

1M+ token 上下文，混合注意力架构（CSA+HCA）长上下文效率最高

推理速度

V4-Flash 输出仅 $0.07/M token，极致低价

关键基准

◆Codeforces Elo: 3,206
◆V4-Flash 价格: $0.04/$0.07 per 1M token（GPT-5.5 的 1/400）
◆V4-Pro: 1.6T/49B MoE，MIT 开源
◆1M+ 上下文，混合注意力架构 CSA+HCA

优势与不足

优势

+极致性价比，API 仅为 GPT-5.5 的 1/400
+MIT 开源可私有化部署，文档清晰
+1M+ 超长上下文，混合注意力架构效率最高
+竞赛编程能力强（Codeforces Elo 3,206）
+中文场景深度优化

不足

−SWE-bench Pro（防污染）仅 55.4%，Agent 稳定性不如 Claude
−海外部署节点少
−多模态能力有限
−Agent 长链任务有时会断

适用场景

高并发线上服务（极致低成本）预算敏感型项目私有化部署与自托管中文场景与竞赛编程