产品解读

DeepSeek V4 — 1.6T 参数 MoE 全开源 · 华为昇腾 SuperNode 零日适配 · 推理侧

V4-Pro 1.6T/49B + V4-Flash 284B/13B 同日开源 MIT · 华为昇腾零日适配(推理侧)· 1M 上下文 / 384K 输出 · 限时 75% 折扣价仅 Claude Opus 4.6 的 1/28

Pro 限定研报

2026-04-25 10 篇信源 读完约 14 分钟

DeepSeek V4 — 1.6T 参数 MoE 全开源 · 华为昇腾 SuperNode 零日适配 · 推理侧

一句话定位

不只是又一个开源模型,而是首发即跑在华为昇腾上的前沿大模型。

2026 年 4 月 24 日,DeepSeek 同时开源 V4-Pro(1.6T/49B active)与 V4-Flash(284B/13B active)两个版本,MIT 协议,HuggingFace 全系开放[1][2]。Bloomberg 称其为"最具野心的新旗舰"[5]。梁文锋与幻方量化出品,深度学习核心团队研发。

3206
Codeforces Rating · 开源最高
93.5%
LiveCodeBench 代码生成
80.6%
SWE Verified · 官方自测
$200亿
目标估值(融资洽谈中)

Spec Sheet

一图看懂 · 模型规格表。

维度DeepSeek V4-Pro / V4-Flash
开 / 闭源全开源 · MIT 协议 · HuggingFace + GitHub 同步发布 · 商用零门槛
模型尺寸(V4-Pro)1.6T 总参 / 49B 激活 · MoE · >32T tokens 预训练
模型尺寸(V4-Flash)284B 总参 / 13B 激活 · MoE · 同样 >32T tokens 预训练
上下文窗口1M tokens 原生 · 不分档定价
最大输出384K tokens · 业界最长之一(适合长篇生成 / Agent 长链)
多模态能力纯文本(V4 系列定位推理 + 编码,多模态待 V4-VL 单独发布)
精度FP4 + FP8 混合(推理部署省一半显存)
输入价格(Pro · 缓存命中)¥0.25 / $0.0363(限时 75% 折扣)· 原价 ¥1 / $0.145
输入价格(Pro · 未命中)¥3 / $0.435(限时 75% 折扣)· 原价 ¥12 / $1.74
输出价格(Pro)¥6 / $0.87(限时 75% 折扣)· 原价 ¥24 / $3.48 · 折扣到 2026-05-05 23:59 北京时间
输出价格(Flash)¥0.5 / $0.07(限时 75% 折扣)· 原价 ¥2 / $0.28
夜间折扣V4 官方文档中 未声明夜间半价规则(V3 时代有过 16:30–00:30 UTC 半价,V4 是否延续待官方公告)
SWE Verified(V4-Pro Max · 自测)80.6% · Claude Opus 4.7 独立验证为 87.6%,方法论差异待第三方复现
SWE Pro(V4-Pro Max · 自测)55.4% · 工程级修复
Codeforces Rating3206(V4-Pro Max 模式)· High 模式仅 2919 · 当前开源最高
LiveCodeBench(V4-Pro Max)93.5% · 顶级动态代码评测
MMLU / MMLU-Pro(V4-Pro Base90.1 / 73.5 · 注:Base 分数,instruct 版未单独公布
GPQA Diamond(V4-Pro Max)90.1 · 研究生级科学推理
MRCR 1M 长上下文(V4-Pro Max)83.5 · 1M 长度下高召回(vs Claude 4.7 的 32.2 大幅领先)
3 种推理强度模式Non-think / Think High / Think Max · Max 建议 ≥384K context
Anthropic API 兼容支持 max_tokens / stream / system / tool / thinking · 不支持:anthropic-beta header / image / cache_control / parallel tools / MCP(全部 ignored 或拒绝)
昇腾合作边界华为 Ascend SuperNode 仅推理侧 day-zero 适配 · 训练仍依赖美国芯片(SCMP 援引华为澄清)
采样参数(特殊)官方推荐 temperature=1.0, top_p=1.0(与一般 LLM 不同)
Chat Template无 Jinja template · 必须使用官方 encoding_dsv4.py 编码(二次集成有摩擦)
LicenseMIT · 商用零门槛
HuggingFacedeepseek-ai/DeepSeek-V4-Pro · V4-Flash
API 端点api.deepseek.com(OpenAI 兼容) · api.deepseek.com/anthropic(Anthropic 兼容)
旧 API 停用日2026-07-24 · deepseek-chat / deepseek-reasoner 退役,需迁 V4
发布日期2026-04-24 · 与腾讯 Hy3 preview 同日发布
融资进展首次启动对外融资 · 目标估值 $20B+(据 The Information 单一信源,DeepSeek 未官方确认)· 腾讯阿里参与谈判
旧 API 弃用deepseek-chat + deepseek-reasoner2026-07-24 15:59 UTC 退役(北京时间 23:59)
V4 选了「全开源 + 跨硬件 + 极致低价」三件套。MIT 协议、HuggingFace 全系开放、昇腾 + NVIDIA 双跑、API 输出价仅 Claude Opus 4.6 的 1/7——这是过去三年最具商业化威胁性的开源动作。