自带密钥 • GA

密钥归你,稳定性交给我们。

继续使用你自己的供应商账号,同时获得健康感知路由、自动切换和完整用量可视化,不必牺牲控制权。

你保留原有的供应商关系和结算方式,TheRouter 负责补上可靠性、可观测性和治理能力。密钥还是你的,调度和网络交给我们。

OpenAI
Anthropic
Google
你的密钥
75+模型
4供应商
2M+最大上下文
<200ms路由延迟
3 行代码即可接入

驱动领先模型品牌的智能路由

Anthropic
OpenAI
Google
xAI

为什么选择 TheRouter

不只是 API 代理——是让你的 AI 架构更可靠、更透明、更灵活的控制平面。

1 行
即可切换供应商

零锁定

保留你的供应商账号和议价。切换模型或供应商只需改一个字符串——无需迁移,无需重写。

  • 兼容 OpenAI SDK — 支持 Cursor、Claude Code 和任何兼容客户端
  • 自带 API Key,保留现有合同关系
  • 几秒内增减供应商,而非几周
3 个控制面
fallback、目标、模型篮子

智能路由

自动故障切换、供应商健康监测和获准范围内的成本优化,让请求继续前进,而且路由证据可见。

  • 供应商宕机时自动切换
  • 获准模型篮子的成本优化(Beta)
  • 请求日志和分析页可见路由与节省证据
100%
花费透明度

全面可视

清楚看到每个 Token 的去向。按团队、Key 或模型追踪用量——在收到意外账单之前设好限额。

  • 按 API Key 实时追踪 Token 与成本
  • 消费限额与预算告警
  • 每个请求的完整审计记录

带着护栏降成本

TheRouter 帮你对比 baseline 成本与实际选路成本,先用 shadow 模式验证更便宜的获准模型,再在日志和分析页里证明节省是否成立。

Beta

获准模型篮子

先定义 baseline 模型,再为同一类工作负载批准更便宜的替代模型。先跑 shadow,再决定是否对这组模型开启 live cost routing。

Baseline: Claude Sonnet 4.6 → 获准替代: GPT-4.1 mini
GA

Prompt 缓存

当上游路由支持缓存时,重复出现的长指令可以按缓存价格计费。对 agent 和重 system prompt 的流程尤其有效。

缓存后的 prompt input 成本可接近未缓存的 1/10
GA

可验证的节省证据

请求日志和 Activity 会展示 baseline charge、selected route、realized savings 与 shadow recommendation,让团队能验证到底省没省到。

日志里直接看 baseline、selected、saved
示意案例:客服分流团队
之前:所有请求都固定走一个高价 baseline 模型
之后:baseline 先被保护住,便宜的获准模型先跑 shadow,验证通过后再对合适流量上线
示意:模型支出可下降 20-35%

这里只是示意案例,不是实测承诺。真实节省幅度取决于你的模型篮子、请求结构和 prompt 形态。

几分钟即可上线

改一行代码,接入所有主流 AI 模型,内置可靠性保障。

指向你的 SDK

将 Base URL 换成 TheRouter。支持任何 OpenAI 兼容客户端 — Cursor、Claude Code、LangChain、你自己的应用。

我们执行你的策略

TheRouter 会先应用 provider 健康、fallback 规则和你的 routing objective。如果第一条路径失败,就自动切到下一个获准路径。

你拿到结果

和你现在使用的响应格式完全一致。再加上用量追踪、成本可视化和团队管控 — 零额外代码。

你的应用TheRouter.ai策略 + 故障切换AnthropicOpenAIGoogle

精选模型

通过统一 API 访问来自顶级供应商的优质模型。

查看全部模型
anthropic1,000,000 上下文
Claude Sonnet 4.6
输入
$3.60 每百万 Tokens
输出
$18.00 每百万 Tokens
能力
文本图像PDF
openai128,000 上下文
GPT-4o
输入
$3.00 每百万 Tokens
输出
$12.00 每百万 Tokens
能力
文本图像
google1,048,576 上下文
Gemini 2.5 Pro
输入
$1.50 每百万 Tokens
输出
$12.00 每百万 Tokens
能力
文本图像PDF

3 行代码开始构建

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.therouter.ai/v1",
  apiKey: "sk-your-key",
});

const response = await client.chat.completions.create({
  model: "anthropic/claude-sonnet-4.6",
  messages: [{ role: "user", content: "Hello!" }],
});