2026 年 4 月 24 日·新模型·English →

DeepSeek V4 现已上线 TheRouter — 直连 API 集成

DeepSeek 于今日发布了 V4 Flash 和 V4 Pro — 迄今最强大的开源模型。 TheRouter 已首日支持，即刻可用。

V4 Flash — 日常任务最佳性价比

284B MoE，13B 活跃参数 — 混合专家架构，每次前向传播仅激活 13B 参数，推理速度快、成本低。
1M 上下文，384K 最大输出 — 单次请求即可处理完整代码库或长文档，输出容量巨大。
默认思考模式 — 内置链式推理默认开启，提升准确性。
$0.14 / $0.28 每 MTok（输入/输出）— 目前最具性价比的推理模型之一。

V4 Pro — 复杂推理重器

1.6T MoE，49B 活跃参数 — 最大的开源 MoE 模型，性能接近 Claude Opus 4.6 非思考模式水平。
1M 上下文，384K 最大输出 — 与 V4 Flash 相同的超大上下文和输出限制。
$1.74 / $3.48 每 MTok（输入/输出）— 在此能力水平上极具竞争力的定价。

基准测试

基准	V4 Pro	V4 Flash	Claude Opus 4.6
SWE-bench Verified	80.6%	79.0%	80.8%
LiveCodeBench	93.5	—	—
Codeforces 评分	3206	—	—

V4 Pro 在 LiveCodeBench 上领先（93.5），并在所有模型中取得最高 Codeforces 评分（3206）。在 SWE-bench Verified 上与 Claude Opus 4.6 仅差 0.2%。

架构

混合注意力架构 — 结合高效注意力机制，同时处理短序列和超长序列。
Engram 条件记忆 — 高效处理 1M 上下文窗口，无需按比例增加计算量。
低活跃参数 MoE — 推理成本远低于同等总参数量的稠密模型。

定价

模型	输入	输出	上下文
V4 Flash	$0.14/MTok	$0.28/MTok	1M
V4 Pro	$1.74/MTok	$3.48/MTok	1M

V4 Flash 是目前最具性价比的推理模型之一。V4 Pro 以远低于闭源模型的价格提供前沿级编码能力。

如何使用

使用标准模型名称 — TheRouter 自动处理路由：

curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THE_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v4-flash",
    "messages": [{"role": "user", "content": "解释 MoE 架构"}],
    "max_tokens": 4096
  }'

V4 Pro 请使用 deepseek/deepseek-v4-pro。两款模型均可通过 全球端点（api.therouter.ai）和 中国端点（airouter-api.mizone.me）访问。

开源

V4 Flash 和 V4 Pro 均以 Apache 2.0 协议发布，完整模型权重可在 Hugging Face 获取。您可以自由部署、微调或商业使用，无任何限制。

快速开始

已在使用 TheRouter？只需将模型设置为 deepseek/deepseek-v4-flash 或 deepseek/deepseek-v4-pro — 无需其他更改。

免费开始快速入门 DeepSeek 供应商

有问题？欢迎在 GitHub 联系我们。