费用
查看会话用量、检查权益余额、控制 token 消耗。
是什么
CrabCode 按 token 用量计费。所有模型调用都经 acosmi 网关统一计量,不与上游 provider 直接发生计费关系:
- 订阅用户 —— 按账户的权益包扣减;每个模型有独立的剩余额度
- 预付费余额用户 —— 按当前模型的单价扣减余额
每条会话本地累积 token 与估算 USD;达到固定阈值时弹一次"费用阈值"提醒对话框。
什么时候用得上
- 费用阈值对话框底部的"了解更多"链接(会话总估算花费跨过阈值时弹一次)
/cost命令的"查看更多"
查看本会话费用
/cost/cost订阅用户会看到当前权益状态(充足 / 即将耗尽 / 已用完)。
非订阅用户会看到一份本会话明细:
- 输入 / 输出 / 缓存读 / 缓存写 token 数(按模型分别列)
- 累计估算 USD 花费(用模型当时的单价)
- API 调用总时长与会话总时长
- 累计代码变更行数
数值来自客户端本地累加,与 acosmi.com 后台的真实账单可能有偏差,以后台为准。
查看每个模型的剩余权益
进入模型选择器(/model)时,每个模型会标注剩余 %。这是网关聚合好的"该模型权益包剩余 / 总额"。看到"权益不足"时表示当前模型的子额度耗尽 —— 切到其他模型或在 acosmi.com 充值/升级套餐即可继续。
费用阈值提醒
CrabCode 会在估算花费跨过内置阈值时弹一次对话框,提示你审视支出节奏。该阈值固定、每会话仅触发一次;不需要也无法在 settings.json 配置。
按 OK 关闭即可继续;如果需要长期降本,从下一节的实操着手。
节省成本的实操
| 做法 | 思路 |
|---|---|
/clear 清掉无关上下文 | 上下文越长每次请求带的 token 越多 |
用 /model 切到更小/更便宜的模型跑日常小任务 | 单价低 |
| 拆任务:探索性问答用小模型,关键改动再切大模型 | 把贵模型的 token 留给关键路径 |
| 利用 prompt caching(网关默认开) | 高度重复的提示词节省读取 token |
| 大量阅读类任务用 subagent | 主 transcript 不被工具输出堆满 |
限制与注意
- 本地估算:
/cost是客户端按模型单价反推的,与 acosmi.com 账单可能有出入,以后台为准 - MCP / WebFetch 的 token 计入会话总量
- subagent 的消耗也算到本会话头上
- 统一计费入口:中国区扣 acosmi.com 余额,国际区扣 acosmi.ai 余额(详见 providers/routing)
- 网关返的 token 才算数:本地估算用于提示,正式计费以网关计量为准