·新模型·English →

DeepSeek V4 现已上线 TheRouter — 直连 API 集成

DeepSeek 于今日发布了 V4 Flash V4 Pro — 迄今最强大的开源模型。 TheRouter 已首日支持,即刻可用。


TheRouter 首日支持 DeepSeek V4 Flash 和 V4 Pro,通过 DeepSeek API 直连接入。V4 Flash:284B MoE,13B 活跃参数,1M 上下文,384K 最大输出,$0.14/$0.28 每 MTok。V4 Pro:1.6T MoE,49B 活跃参数,1M 上下文,384K 最大输出,$1.74/$3.48 每 MTok。两款模型均采用混合注意力架构和 Engram 条件记忆。Apache 2.0 开源协议,权重发布于 Hugging Face。模型 ID:deepseek/deepseek-v4-flash、deepseek/deepseek-v4-pro。

V4 Flash — 日常任务最佳性价比

  • 284B MoE,13B 活跃参数 — 混合专家架构,每次前向传播仅激活 13B 参数,推理速度快、成本低。
  • 1M 上下文,384K 最大输出 — 单次请求即可处理完整代码库或长文档,输出容量巨大。
  • 默认思考模式 — 内置链式推理默认开启,提升准确性。
  • $0.14 / $0.28 每 MTok(输入/输出)— 目前最具性价比的推理模型之一。

V4 Pro — 复杂推理重器

  • 1.6T MoE,49B 活跃参数 — 最大的开源 MoE 模型,性能接近 Claude Opus 4.6 非思考模式水平。
  • 1M 上下文,384K 最大输出 — 与 V4 Flash 相同的超大上下文和输出限制。
  • $1.74 / $3.48 每 MTok(输入/输出)— 在此能力水平上极具竞争力的定价。

基准测试

基准V4 ProV4 FlashClaude Opus 4.6
SWE-bench Verified80.6%79.0%80.8%
LiveCodeBench93.5
Codeforces 评分3206

V4 Pro 在 LiveCodeBench 上领先(93.5),并在所有模型中取得最高 Codeforces 评分(3206)。在 SWE-bench Verified 上与 Claude Opus 4.6 仅差 0.2%。

架构

  • 混合注意力架构 — 结合高效注意力机制,同时处理短序列和超长序列。
  • Engram 条件记忆 — 高效处理 1M 上下文窗口,无需按比例增加计算量。
  • 低活跃参数 MoE — 推理成本远低于同等总参数量的稠密模型。

定价

模型输入输出上下文
V4 Flash$0.14/MTok$0.28/MTok1M
V4 Pro$1.74/MTok$3.48/MTok1M

V4 Flash 是目前最具性价比的推理模型之一。V4 Pro 以远低于闭源模型的价格提供前沿级编码能力。

如何使用

使用标准模型名称 — TheRouter 自动处理路由:

curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THE_ROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek/deepseek-v4-flash",
    "messages": [{"role": "user", "content": "解释 MoE 架构"}],
    "max_tokens": 4096
  }'

V4 Pro 请使用 deepseek/deepseek-v4-pro。两款模型均可通过 全球端点api.therouter.ai)和 中国端点airouter-api.mizone.me)访问。

开源

V4 Flash 和 V4 Pro 均以 Apache 2.0 协议发布,完整模型权重可在 Hugging Face 获取。您可以自由部署、微调或商业使用,无任何限制。

快速开始

已在使用 TheRouter?只需将模型设置为 deepseek/deepseek-v4-flash deepseek/deepseek-v4-pro — 无需其他更改。


有问题?欢迎在 GitHub 联系我们。