语音通话 (Archive)
Archived original-language source from the legacy CrabClaw docs. This page is intentionally not machine-translated.
Crab Claw 支持 AI 驱动的语音通话能力,让智能体不仅能文字对话,还能通过语音与用户实时交流。
核心功能
发起语音通话
通过 CLI 或聊天指令向联系人发起 AI 语音通话,智能体自动接听并进行实时对话。
实时语音交互
基于语音识别(STT)和语音合成(TTS)的双向实时对话,延迟低、体验自然。
通话中继续对话
通话过程中可发送文字消息补充上下文,智能体同时处理语音和文字。
服务暴露
将语音通话服务暴露到公网,支持外部系统接入和 Webhook 触发。
CLI 命令
# 查看通话状态
crabclaw voicecall status
# 发起通话
crabclaw voicecall call <contact>
# 通话中发送消息
crabclaw voicecall continue "请帮我查一下明天的天气"
# 结束通话
crabclaw voicecall end
# 暴露语音服务到公网
crabclaw voicecall expose
# 取消暴露
crabclaw voicecall unexpose# 查看通话状态
crabclaw voicecall status
# 发起通话
crabclaw voicecall call <contact>
# 通话中发送消息
crabclaw voicecall continue "请帮我查一下明天的天气"
# 结束通话
crabclaw voicecall end
# 暴露语音服务到公网
crabclaw voicecall expose
# 取消暴露
crabclaw voicecall unexpose在聊天中使用
> 给张三打电话
> 通话中: 帮我查一下明天的航班
> 结束通话
> 把语音通话服务暴露出去> 给张三打电话
> 通话中: 帮我查一下明天的航班
> 结束通话
> 把语音通话服务暴露出去通话流程
发起通话 (voicecall call)
│
▼
建立连接 → STT 引擎就绪 → TTS 引擎就绪
│
▼
实时对话循环:
用户语音 → STT 转文字 → Agent 处理 → TTS 合成 → 语音播放
│
├─ 可穿插文字消息 (voicecall continue)
│
├─ Agent 可使用全部工具(搜索、文件、浏览器等)
│
└─ 通话结束 (voicecall end) → 保存通话记录发起通话 (voicecall call)
│
▼
建立连接 → STT 引擎就绪 → TTS 引擎就绪
│
▼
实时对话循环:
用户语音 → STT 转文字 → Agent 处理 → TTS 合成 → 语音播放
│
├─ 可穿插文字消息 (voicecall continue)
│
├─ Agent 可使用全部工具(搜索、文件、浏览器等)
│
└─ 通话结束 (voicecall end) → 保存通话记录服务暴露
通过 voicecall expose 将语音通话接口暴露到公网:
- 外部系统可通过 API 发起通话
- 支持 Webhook 回调通知通话状态
- 可用于客服场景、电话机器人等
# 暴露后获得公网 URL
crabclaw voicecall expose
# → Voice service exposed at https://xxx.ngrok.io/voice
# 取消暴露
crabclaw voicecall unexpose# 暴露后获得公网 URL
crabclaw voicecall expose
# → Voice service exposed at https://xxx.ngrok.io/voice
# 取消暴露
crabclaw voicecall unexpose