网关路由
CrabCode 所有模型调用都经 acosmi 网关代理:统一账号、统一计费、自动回退。
是什么
CrabCode 不直接调用上游模型供应商。客户端把请求发到 acosmi 网关(acosmi.com 或 acosmi.ai),由网关再路由到具体的上游模型。
从用户视角看就三件事:
- 在
/model里选一个模型 - 发请求,网关帮你路由
- acosmi 余额按 token 单价 × 模型系数扣费
具体路由策略、上游供应商映射、wire 协议适配这些细节属于网关内部实现,CrabCode 客户端不感知。
自动回退
CrabCode 配了一组默认模型与回退模型,当主模型遇到瞬时故障时,会自动切到回退模型继续完成下一轮请求:
- 默认主模型:
deepseek-v4-flash - 默认回退模型:
qwen3.6-plus
回退触发的常见场景:
- 主模型上游短时不可用(5xx / 超时)
- 持续 429 / 一段时间后仍未恢复
- 主模型在你的账户上未启用 / 模型已下线
回退是整轮粒度 —— 当前请求结束后下一轮才会切,不会在响应中途切模型。CrabCode 会在 TUI 中打印一条系统提示告诉你切了哪个模型。
错误码与用户视角行为
| 错误 | 含义 | CrabCode 行为 |
|---|---|---|
HTTP 402 [overloaded_error] 流量包权益不足 | 当前模型对应的套餐桶已用尽 | 不重试。需要充值或切到其它模型 |
HTTP 429 短退避 | 限流,瞬时拥塞 | 按内置策略短退避重试 ≤ 2 次 |
HTTP 429 长退避(Retry-After ≥ 60s) | 限流,配额耗尽 | 不重试,直接报错;考虑切模型 |
| 上游 5xx / 网络抖动 | 短时故障 | 自动重试若干次,仍失败则切回退模型 |
并发预算
CrabCode 在客户端侧对并发请求有内置预算(subagent 并发上限),避免自造拥塞。这是和网关的约定,不需要也不应该自己调高。
自定义模型
CrabCode 支持配置自定义模型(绕开 acosmi 网关,直接调用第三方主流对话补全 API 端点),需要 CrabCode Pro / Max / Team / Enterprise 套餐。这部分不走本文描述的网关路由,端点协议格式按 /login → "自定义模型配置" 流程内的提示选择。
排错
- 不知道当前在用哪个模型 →
/model - 不知道这轮调用为什么慢 / 报错 → 查看 TUI 中的系统提示与
/cost - 怀疑某个模型不可用 →
/model <slug>切到其它模型试一下