公告 · 2026-05-05

2026 五月模型上新

TheRouter 一次性接入 6 个新模型。Kimi K2.6 编码评测对标 GPT-5.5;Qwen 3.6 连跨两代;Gemma 4 改为 Apache 2.0;Mistral 同时发布统一版 Small 4 和首个 TTS。

本次新增的模型

2026 年 3 月底到 4 月底,四个主流模型家族陆续发布了重要新版本。我们对每个上游都做了 端到端真实推理验证,然后向网关追加了下面 6 个 alias。已有模型完全不动 —— 本次发布是严格“只新增不修改”,我们用一份字节级 snapshot 回归测试保证 181 个老 alias 的行为完全一致。

Moonshot — Kimi K2.6

2026-04-20 发布。Kimi K2.6 是月之暗面的 1T 参数 MoE 旗舰。 编码评测追平 GPT-5.5,但价格仍是开源权重的水平。Agent swarm 子系统从 K2.5 的 100 个 sub-agent / 1500 步扩到 K2.6 的 300 个 sub-agent / 4000 步。 Alias 为 moonshot/kimi-k2.6

阿里 — Qwen 3.6 35B-A3B

2026-04-16 发布。Qwen 3.6 引入了 hybrid multimodal、262K 上下文、显著加强 repo 级编码能力。我们这次接入的是 35B 总参/3B active 的 MoE 变体 —— 这是 SiliconFlow 当前唯一上架的 3.6 版本。Alias qwen/qwen3.6-35b-a3b。(27B 稠密版要等 DashScope 接入,后续单独排期。)

Google — Gemma 4 (Apache 2.0)

2026-04-02 发布。本次接入两个服务器级别尺寸:google/gemma-4-31b(稠密,开源 Arena 第 3)和 google/gemma-4-26b-moe(MoE,4B active,开源 Arena 第 6)。 两个都改为 Apache 2.0 license —— Gemma 系列发布以来最宽松的协议。 都支持文本 + 图像输入。

Mistral — Small 4

2026-03 发布。119B MoE / 6B active 的统一模型,把之前三个 专精模型 Magistral(推理)、Pixtral(多模态)、Devstral(agentic 编码)的能力 合并到一个模型里。默认开启 tools / vision / JSON mode。Alias mistral/mistral-small-4

Mistral — Voxtral TTS

2026-03-26 发布。Mistral 第一个多语言 TTS 模型。9 种语言、 30+ 预设音色、低延迟流式输出,支持通过参考音频自定义音色。Alias mistral/voxtral-ttsvoice 字段需要传 voice slug (例如 en_paul_neutral),完整列表见 GET /v1/audio/voices

怎么用

新 alias 通过 TheRouter 的 OpenAI 兼容 API 直接调用:

curl https://api.therouter.ai/v1/chat/completions \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "moonshot/kimi-k2.6",
    "messages": [{"role": "user", "content": "用 Rust 写一个快排"}],
    "max_tokens": 1024
  }'

Voxtral TTS 走 audio endpoint:

curl https://api.therouter.ai/v1/audio/speech \
  -H "Authorization: Bearer $THEROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mistral/voxtral-tts",
    "input": "Hello from TheRouter",
    "voice": "en_paul_neutral"
  }'

定价(美元 / 百万 token)

模型输入输出
moonshot/kimi-k2.6$0.95$4.50
qwen/qwen3.6-35b-a3b$0.20$0.80
google/gemma-4-31b$0.30$0.50
google/gemma-4-26b-moe$0.20$0.40
mistral/mistral-small-4$0.20$0.60
mistral/voxtral-tts$12 / 百万字符

已有模型完全不变

本次上线之前已经存在的所有模型(参见模型目录) 行为完全保持一致。我们带了一份 snapshot 回归测试,会逐字段比对 181 个老 alias 的 定价、modality、capabilities、路由 —— 任何一项漂移都会让测试失败。这次测试通过, 证明改动是严格 additive。

下一波

两个本次未接入的型号已经登记跟进:qwen/qwen3.6-27b(27B 稠密版, 等 DashScope 上游接入)和 google/gemma-4-e4b(effective 4B, 端侧用途为主,服务端是否托管待定)。等上游可用之后,会跟下一波模型一起上。

欢迎在 dashboard.therouter.ai 试用,或者直接调 API。反馈邮箱 hello@therouter.ai