DeepSeek V4 — 1.6T 参数 MoE 全开源 · 华为昇腾 SuperNode 零日适配 · 推理侧
一句话定位
不只是又一个开源模型,而是首发即跑在华为昇腾上的前沿大模型。
2026 年 4 月 24 日,DeepSeek 同时开源 V4-Pro(1.6T/49B active)与 V4-Flash(284B/13B active)两个版本,MIT 协议,HuggingFace 全系开放[1][2]。Bloomberg 称其为"最具野心的新旗舰"[5]。梁文锋与幻方量化出品,深度学习核心团队研发。
3206
Codeforces Rating · 开源最高
93.5%
LiveCodeBench 代码生成
80.6%
SWE Verified · 官方自测
$200亿
目标估值(融资洽谈中)
Spec Sheet
一图看懂 · 模型规格表。
| 维度 | DeepSeek V4-Pro / V4-Flash |
|---|---|
| 开 / 闭源 | 全开源 · MIT 协议 · HuggingFace + GitHub 同步发布 · 商用零门槛 |
| 模型尺寸(V4-Pro) | 1.6T 总参 / 49B 激活 · MoE · >32T tokens 预训练 |
| 模型尺寸(V4-Flash) | 284B 总参 / 13B 激活 · MoE · 同样 >32T tokens 预训练 |
| 上下文窗口 | 1M tokens 原生 · 不分档定价 |
| 最大输出 | 384K tokens · 业界最长之一(适合长篇生成 / Agent 长链) |
| 多模态能力 | 纯文本(V4 系列定位推理 + 编码,多模态待 V4-VL 单独发布) |
| 精度 | FP4 + FP8 混合(推理部署省一半显存) |
| 输入价格(Pro · 缓存命中) | ¥0.25 / $0.0363(限时 75% 折扣)· 原价 ¥1 / $0.145 |
| 输入价格(Pro · 未命中) | ¥3 / $0.435(限时 75% 折扣)· 原价 ¥12 / $1.74 |
| 输出价格(Pro) | ¥6 / $0.87(限时 75% 折扣)· 原价 ¥24 / $3.48 · 折扣到 2026-05-05 23:59 北京时间 |
| 输出价格(Flash) | ¥0.5 / $0.07(限时 75% 折扣)· 原价 ¥2 / $0.28 |
| 夜间折扣 | V4 官方文档中 未声明夜间半价规则(V3 时代有过 16:30–00:30 UTC 半价,V4 是否延续待官方公告) |
| SWE Verified(V4-Pro Max · 自测) | 80.6% · Claude Opus 4.7 独立验证为 87.6%,方法论差异待第三方复现 |
| SWE Pro(V4-Pro Max · 自测) | 55.4% · 工程级修复 |
| Codeforces Rating | 3206(V4-Pro Max 模式)· High 模式仅 2919 · 当前开源最高 |
| LiveCodeBench(V4-Pro Max) | 93.5% · 顶级动态代码评测 |
| MMLU / MMLU-Pro(V4-Pro Base) | 90.1 / 73.5 · 注:Base 分数,instruct 版未单独公布 |
| GPQA Diamond(V4-Pro Max) | 90.1 · 研究生级科学推理 |
| MRCR 1M 长上下文(V4-Pro Max) | 83.5 · 1M 长度下高召回(vs Claude 4.7 的 32.2 大幅领先) |
| 3 种推理强度模式 | Non-think / Think High / Think Max · Max 建议 ≥384K context |
| Anthropic API 兼容 | 支持 max_tokens / stream / system / tool / thinking · 不支持:anthropic-beta header / image / cache_control / parallel tools / MCP(全部 ignored 或拒绝) |
| 昇腾合作边界 | 华为 Ascend SuperNode 仅推理侧 day-zero 适配 · 训练仍依赖美国芯片(SCMP 援引华为澄清) |
| 采样参数(特殊) | 官方推荐 temperature=1.0, top_p=1.0(与一般 LLM 不同) |
| Chat Template | 无 Jinja template · 必须使用官方 encoding_dsv4.py 编码(二次集成有摩擦) |
| License | MIT · 商用零门槛 |
| HuggingFace | deepseek-ai/DeepSeek-V4-Pro · V4-Flash |
| API 端点 | api.deepseek.com(OpenAI 兼容) · api.deepseek.com/anthropic(Anthropic 兼容) |
| 旧 API 停用日 | 2026-07-24 · deepseek-chat / deepseek-reasoner 退役,需迁 V4 |
| 发布日期 | 2026-04-24 · 与腾讯 Hy3 preview 同日发布 |
| 融资进展 | 首次启动对外融资 · 目标估值 $20B+(据 The Information 单一信源,DeepSeek 未官方确认)· 腾讯阿里参与谈判 |
| 旧 API 弃用 | deepseek-chat + deepseek-reasoner 在 2026-07-24 15:59 UTC 退役(北京时间 23:59) |