输入形态
CrabCode 不止是终端命令行 —— 还有语音、桌面 App、手机、浏览器自动化、IDE 插件等多种接入形态。
是什么
CrabCode 主形态是终端 CLI(TUI),但同一份核心能力可以从多个入口用到:
- 终端 TUI(默认)—— 装上
crabcode直接跑 - 语音输入 ——
/voice在 TUI 里按住快捷键说话,自动转文字 - CrabCode Desktop App(macOS / Windows)——
/desktop把当前会话切换到原生桌面 App 继续 - iOS / Android 移动 App ——
/mobile显示 App Store / Google Play 二维码 - 浏览器自动化 —— 默认用 CLI 模式操作独立 Chromium,需要真实 Chrome 登录态时切到扩展模式(见 浏览器自动化,扩展安装见 浏览器扩展安装向导)
- IDE 插件 —— 在 JetBrains 系列里集成(见 ide-jetbrains.md)
- 远程网页会话 ——
/ultraplan等命令把会话跑到 acosmi.com 网页端(见 crabcode-on-the-web)
不同形态共享同一个账号、同一份配置(settings.json)、同一套技能(skills.md)和 MCP(mcp.md)。
语音输入
/voice/voice打开 / 关闭语音模式。开启时按住语音快捷键(默认 Space)讲话,松开自动停止并把转写结果填到输入框。
要求:
- 登录的 Acosmi 账号(语音转写走 acosmi.com 后端)
- 系统授予麦克风权限(macOS:系统设置 → 隐私 → 麦克风;Windows:设置 → 隐私 → 麦克风;Linux:系统音频设置)
- 系统装有录音工具(macOS 一般自带;Linux 通常需要
sox)
第一次开启时会自动跑一遍依赖检查,缺什么会告诉你怎么装。听写语言取决于 /config 里的 language 字段,不支持的语言会回退到英文并在提示里说明。
CrabCode Desktop App(桌面应用)
/desktop/desktop把当前会话 handoff 到原生 CrabCode Desktop(一个独立的桌面 App,macOS / Windows x64)。在 TUI 里跑这条命令,会:
- 检查本机是否装了 Desktop App,没装就引导下载
- 把当前会话状态刷盘
- 打开 Desktop 并恢复同一个会话
适合:长时间会话、想要更大窗口 / 鼠标交互、不想守在终端时。Linux 暂不支持。
注:还存在一个实验中的应用内 GUI 形态(基于 Tauri 内嵌)。它和上面这个独立 Desktop App 不是同一个东西,目前还不是稳定面向用户的入口,本文档不展开。
移动端(iOS / Android)
/mobile/mobile显示 iOS 和 Android 版 Acosmi App 的二维码 —— 扫码即可跳到对应商店下载。
移动 App 不是把整个 CLI 搬到手机上 —— 它走的是 Acosmi 平台的对话面,适合在路上看长跑任务的结果、回个消息。重活仍然在台式机 / 笔记本上跑。
浏览器自动化
CrabCode 的浏览器自动化有两种后端:
- CLI 模式:默认模式,通过
crabcode browser/playwright-cli启动独立 Chromium,适合前端调试、E2E、截图、console 和网络检查。 - 扩展模式:通过 CrabCode in Chrome 扩展连接你日常使用的 Chrome,适合复用真实登录态、OAuth/SSO、内网页面和必须在当前 Chrome 会话里完成的调试。
两种模式的 cookies、登录态、本地存储和下载目录互不共享;常规页面验证优先用 CLI 模式,需要真实账号时再显式切到扩展模式。详见 浏览器自动化,扩展安装包和步骤见 浏览器扩展安装向导。
注意:这是 CrabCode 操作 Chrome,不是「在 Chrome 里跑 CrabCode UI」。
IDE 集成
JetBrains 系列(IntelliJ / WebStorm / PyCharm 等)有官方插件,详见 ide-jetbrains。VSCode 走的是另一条路径,目前主要靠 TUI + 内嵌终端。
远程网页会话
/ultraplan <任务描述>/ultraplan <任务描述>把会话跑到 acosmi.com 的网页端 —— 终端继续可用,远程那边长跑结束后会回来通知。详见 crabcode-on-the-web 和 plan-mode。
怎么选
| 你要做的事 | 推荐形态 |
|---|---|
| 日常写代码、改 bug | 终端 TUI(默认) |
| 手没空(开车、做饭)但要起个任务 | 语音输入 |
| 长会话、想要更舒服的窗口 | CrabCode Desktop App |
| 在路上看远程任务进度 | iOS / Android App |
| 让 AI 操作浏览器(前端调试、E2E) | 浏览器自动化 CLI 模式 |
| 复用当前 Chrome 登录态 / OAuth / 内网页面 | 浏览器扩展模式 |
| 在 IDE 里集成 | JetBrains 插件 |
| 长跑大规划,终端不想守着 | 远程网页 + /ultraplan |
限制与注意
- 入口多 ≠ 能力倍增:所有形态最终都走同一份 CrabCode 核心 + 同一个 Acosmi 账号,能力上限是一致的,区别只在交互方式
- 语音 / 桌面 App / 移动 App 都需要 Acosmi 账号:第三方 provider 直连模式下这些入口可能不可用
- 设置同步:用户级 settings 跨形态共享,但项目级 settings 只在跑在该项目目录下的形态可见
- macOS / Linux / Windows 支持面不一致:Desktop App 当前仅 macOS + Windows x64;语音的录音工具在 Linux 需要手装