文档
推荐给好友,福利领不停!好友同步开通最高 1000 万词元额度 · 后续消费分佣最高 30%。
+50万 Token生成链接

网关路由

CrabCode 所有模型调用都经 acosmi 网关代理:统一账号、统一计费、自动回退。

是什么

CrabCode 不直接调用上游模型供应商。客户端把请求发到 acosmi 网关(acosmi.comacosmi.ai),由网关再路由到具体的上游模型。

从用户视角看就三件事:

  1. /model 里选一个模型
  2. 发请求,网关帮你路由
  3. acosmi 余额按 token 单价 × 模型系数扣费

具体路由策略、上游供应商映射、wire 协议适配这些细节属于网关内部实现,CrabCode 客户端不感知。

自动回退

CrabCode 配了一组默认模型与回退模型,当主模型遇到瞬时故障时,会自动切到回退模型继续完成下一轮请求:

  • 默认主模型:deepseek-v4-flash
  • 默认回退模型:qwen3.6-plus

回退触发的常见场景:

  • 主模型上游短时不可用(5xx / 超时)
  • 持续 429 / 一段时间后仍未恢复
  • 主模型在你的账户上未启用 / 模型已下线

回退是整轮粒度 —— 当前请求结束后下一轮才会切,不会在响应中途切模型。CrabCode 会在 TUI 中打印一条系统提示告诉你切了哪个模型。

错误码与用户视角行为

错误含义CrabCode 行为
HTTP 402 [overloaded_error] 流量包权益不足当前模型对应的套餐桶已用尽不重试。需要充值或切到其它模型
HTTP 429 短退避限流,瞬时拥塞按内置策略短退避重试 ≤ 2 次
HTTP 429 长退避(Retry-After ≥ 60s)限流,配额耗尽不重试,直接报错;考虑切模型
上游 5xx / 网络抖动短时故障自动重试若干次,仍失败则切回退模型

并发预算

CrabCode 在客户端侧对并发请求有内置预算(subagent 并发上限),避免自造拥塞。这是和网关的约定,不需要也不应该自己调高。

自定义模型

CrabCode 支持配置自定义模型(绕开 acosmi 网关,直接调用第三方主流对话补全 API 端点),需要 CrabCode Pro / Max / Team / Enterprise 套餐。这部分不走本文描述的网关路由,端点协议格式按 /login → "自定义模型配置" 流程内的提示选择。

排错

  • 不知道当前在用哪个模型/model
  • 不知道这轮调用为什么慢 / 报错 → 查看 TUI 中的系统提示与 /cost
  • 怀疑某个模型不可用/model <slug> 切到其它模型试一下

相关