文档
推荐给好友,福利领不停!好友同步开通最高 1000 万词元额度 · 后续消费分佣最高 30%。
+50万 Token生成链接

费用

查看会话用量、检查权益余额、控制 token 消耗。

是什么

CrabCode 按 token 用量计费。所有模型调用都经 acosmi 网关统一计量,不与上游 provider 直接发生计费关系:

  • 订阅用户 —— 按账户的权益包扣减;每个模型有独立的剩余额度
  • 预付费余额用户 —— 按当前模型的单价扣减余额

每条会话本地累积 token 与估算 USD;达到固定阈值时弹一次"费用阈值"提醒对话框。

什么时候用得上

  • 费用阈值对话框底部的"了解更多"链接(会话总估算花费跨过阈值时弹一次)
  • /cost 命令的"查看更多"

查看本会话费用

shell
/cost
/cost

订阅用户会看到当前权益状态(充足 / 即将耗尽 / 已用完)。

非订阅用户会看到一份本会话明细:

  • 输入 / 输出 / 缓存读 / 缓存写 token 数(按模型分别列)
  • 累计估算 USD 花费(用模型当时的单价)
  • API 调用总时长与会话总时长
  • 累计代码变更行数

数值来自客户端本地累加,与 acosmi.com 后台的真实账单可能有偏差,以后台为准。

查看每个模型的剩余权益

进入模型选择器(/model)时,每个模型会标注剩余 %。这是网关聚合好的"该模型权益包剩余 / 总额"。看到"权益不足"时表示当前模型的子额度耗尽 —— 切到其他模型或在 acosmi.com 充值/升级套餐即可继续。

费用阈值提醒

CrabCode 会在估算花费跨过内置阈值时弹一次对话框,提示你审视支出节奏。该阈值固定、每会话仅触发一次;不需要也无法在 settings.json 配置。

按 OK 关闭即可继续;如果需要长期降本,从下一节的实操着手。

节省成本的实操

做法思路
/clear 清掉无关上下文上下文越长每次请求带的 token 越多
/model 切到更小/更便宜的模型跑日常小任务单价低
拆任务:探索性问答用小模型,关键改动再切大模型把贵模型的 token 留给关键路径
利用 prompt caching(网关默认开)高度重复的提示词节省读取 token
大量阅读类任务用 subagent主 transcript 不被工具输出堆满

限制与注意

  • 本地估算/cost 是客户端按模型单价反推的,与 acosmi.com 账单可能有出入,以后台为准
  • MCP / WebFetch 的 token 计入会话总量
  • subagent 的消耗也算到本会话头上
  • 统一计费入口:中国区扣 acosmi.com 余额,国际区扣 acosmi.ai 余额(详见 providers/routing
  • 网关返的 token 才算数:本地估算用于提示,正式计费以网关计量为准

相关