网关路由

CrabCode 所有模型调用都经 acosmi 网关代理：统一账号、统一计费、自动回退。

是什么

CrabCode 不直接调用上游模型供应商。客户端把请求发到 acosmi 网关（acosmi.com 或 acosmi.ai），由网关再路由到具体的上游模型。

从用户视角看就三件事：

在 /model 里选一个模型
发请求，网关帮你路由
acosmi 余额按 token 单价 × 模型系数扣费

具体路由策略、上游供应商映射、wire 协议适配这些细节属于网关内部实现，CrabCode 客户端不感知。

自动回退

CrabCode 配了一组默认模型与回退模型，当主模型遇到瞬时故障时，会自动切到回退模型继续完成下一轮请求：

默认主模型：deepseek-v4-flash
默认回退模型：qwen3.6-plus

回退触发的常见场景：

主模型上游短时不可用（5xx / 超时）
持续 429 / 一段时间后仍未恢复
主模型在你的账户上未启用 / 模型已下线

回退是整轮粒度 —— 当前请求结束后下一轮才会切，不会在响应中途切模型。CrabCode 会在 TUI 中打印一条系统提示告诉你切了哪个模型。

错误码与用户视角行为

错误	含义	CrabCode 行为
`HTTP 402 [overloaded_error] 流量包权益不足`	当前模型对应的套餐桶已用尽	不重试。需要充值或切到其它模型
`HTTP 429` 短退避	限流，瞬时拥塞	按内置策略短退避重试 ≤ 2 次
`HTTP 429` 长退避（Retry-After ≥ 60s）	限流，配额耗尽	不重试，直接报错；考虑切模型
上游 5xx / 网络抖动	短时故障	自动重试若干次，仍失败则切回退模型

并发预算

CrabCode 在客户端侧对并发请求有内置预算（subagent 并发上限），避免自造拥塞。这是和网关的约定，不需要也不应该自己调高。

自定义模型

CrabCode 支持配置自定义模型（绕开 acosmi 网关，直接调用第三方主流对话补全 API 端点），需要 CrabCode Pro / Max / Team / Enterprise 套餐。这部分不走本文描述的网关路由，端点协议格式按 /login → "自定义模型配置" 流程内的提示选择。

排错

不知道当前在用哪个模型 → /model
不知道这轮调用为什么慢 / 报错 → 查看 TUI 中的系统提示与 /cost
怀疑某个模型不可用 → /model <slug> 切到其它模型试一下

网关路由

是什么

自动回退

错误码与用户视角行为

并发预算

自定义模型

排错

相关