文档
推荐给好友,福利领不停!好友同步开通最高 1000 万词元额度 · 后续消费分佣最高 30%。
+50万 Token生成链接

语音通话

AI 驱动的语音通话能力 — 实时对话、通话管理与服务暴露

Crab Claw 支持 AI 驱动的语音通话能力,让智能体不仅能文字对话,还能通过语音与用户实时交流。

核心功能

CLI 命令

bash
# 查看通话状态
crabclaw voicecall status

# 发起通话
crabclaw voicecall call <contact>

# 通话中发送消息
crabclaw voicecall continue "请帮我查一下明天的天气"

# 结束通话
crabclaw voicecall end

# 暴露语音服务到公网
crabclaw voicecall expose

# 取消暴露
crabclaw voicecall unexpose
# 查看通话状态
crabclaw voicecall status

# 发起通话
crabclaw voicecall call <contact>

# 通话中发送消息
crabclaw voicecall continue "请帮我查一下明天的天气"

# 结束通话
crabclaw voicecall end

# 暴露语音服务到公网
crabclaw voicecall expose

# 取消暴露
crabclaw voicecall unexpose

在聊天中使用

shell
> 给张三打电话
> 通话中: 帮我查一下明天的航班
> 结束通话
> 把语音通话服务暴露出去
> 给张三打电话
> 通话中: 帮我查一下明天的航班
> 结束通话
> 把语音通话服务暴露出去

通话流程

shell
发起通话 (voicecall call)


建立连接 STT 引擎就绪 TTS 引擎就绪


实时对话循环:
  用户语音 STT 转文字 Agent 处理 TTS 合成 语音播放

    ├─ 可穿插文字消息 (voicecall continue)

    ├─ Agent 可使用全部工具(搜索、文件、浏览器等)

    └─ 通话结束 (voicecall end) → 保存通话记录
发起通话 (voicecall call)


建立连接 STT 引擎就绪 TTS 引擎就绪


实时对话循环:
  用户语音 STT 转文字 Agent 处理 TTS 合成 语音播放

    ├─ 可穿插文字消息 (voicecall continue)

    ├─ Agent 可使用全部工具(搜索、文件、浏览器等)

    └─ 通话结束 (voicecall end) → 保存通话记录

服务暴露

通过 voicecall expose 将语音通话接口暴露到公网:

  • 外部系统可通过 API 发起通话
  • 支持 Webhook 回调通知通话状态
  • 可用于客服场景、电话机器人等
bash
# 暴露后获得公网 URL
crabclaw voicecall expose
# → Voice service exposed at https://xxx.ngrok.io/voice

# 取消暴露
crabclaw voicecall unexpose
# 暴露后获得公网 URL
crabclaw voicecall expose
# → Voice service exposed at https://xxx.ngrok.io/voice

# 取消暴露
crabclaw voicecall unexpose

相关文档:消息频道 · 功能特性