费用

查看会话用量、检查权益余额、控制 token 消耗。

是什么

CrabCode 按 token 用量计费。所有模型调用都经 acosmi 网关统一计量，不与上游 provider 直接发生计费关系：

订阅用户 —— 按账户的权益包扣减；每个模型有独立的剩余额度
预付费余额用户 —— 按当前模型的单价扣减余额

每条会话本地累积 token 与估算 USD；达到固定阈值时弹一次"费用阈值"提醒对话框。

什么时候用得上

费用阈值对话框底部的"了解更多"链接（会话总估算花费跨过阈值时弹一次）
/cost 命令的"查看更多"

查看本会话费用

shell

/cost
/cost

订阅用户会看到当前权益状态（充足 / 即将耗尽 / 已用完）。

非订阅用户会看到一份本会话明细：

输入 / 输出 / 缓存读 / 缓存写 token 数（按模型分别列）
累计估算 USD 花费（用模型当时的单价）
API 调用总时长与会话总时长
累计代码变更行数

数值来自客户端本地累加，与 acosmi.com 后台的真实账单可能有偏差，以后台为准。

查看每个模型的剩余权益

进入模型选择器（/model）时，每个模型会标注剩余 %。这是网关聚合好的"该模型权益包剩余 / 总额"。看到"权益不足"时表示当前模型的子额度耗尽 —— 切到其他模型或在 acosmi.com 充值/升级套餐即可继续。

费用阈值提醒

CrabCode 会在估算花费跨过内置阈值时弹一次对话框，提示你审视支出节奏。该阈值固定、每会话仅触发一次；不需要也无法在 settings.json 配置。

按 OK 关闭即可继续；如果需要长期降本，从下一节的实操着手。

节省成本的实操

做法	思路
`/clear` 清掉无关上下文	上下文越长每次请求带的 token 越多
用 `/model` 切到更小/更便宜的模型跑日常小任务	单价低
拆任务：探索性问答用小模型，关键改动再切大模型	把贵模型的 token 留给关键路径
利用 prompt caching（网关默认开）	高度重复的提示词节省读取 token
大量阅读类任务用 subagent	主 transcript 不被工具输出堆满

限制与注意

本地估算：/cost 是客户端按模型单价反推的，与 acosmi.com 账单可能有出入，以后台为准
MCP / WebFetch 的 token 计入会话总量
subagent 的消耗也算到本会话头上
统一计费入口：中国区扣 acosmi.com 余额，国际区扣 acosmi.ai 余额（详见 providers/routing）
网关返的 token 才算数：本地估算用于提示，正式计费以网关计量为准

相关