Skip to content

Commit e8f417e

Browse files
Merge remote-tracking branch 'origin/feature/computer-use/mac-support'
2 parents f83198e + 765569b commit e8f417e

10 files changed

Lines changed: 620 additions & 436 deletions

File tree

CLAUDE.md

Lines changed: 39 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -51,8 +51,8 @@ bun run docs:dev
5151
### Runtime & Build
5252

5353
- **Runtime**: Bun (not Node.js). All imports, builds, and execution use Bun APIs.
54-
- **Build**: `build.ts` 执行 `Bun.build()` with `splitting: true`,入口 `src/entrypoints/cli.tsx`,输出 `dist/cli.js` + chunk files。默认启用 `AGENT_TRIGGERS_REMOTE` feature。构建后自动替换 `import.meta.require` 为 Node.js 兼容版本(产物 bun/node 都可运行)。
55-
- **Dev mode**: `scripts/dev.ts` 通过 Bun `-d` flag 注入 `MACRO.*` defines,运行 `src/entrypoints/cli.tsx`。默认启用 `BUDDY``TRANSCRIPT_CLASSIFIER``BRIDGE_MODE``AGENT_TRIGGERS_REMOTE` 四个 feature。
54+
- **Build**: `build.ts` 执行 `Bun.build()` with `splitting: true`,入口 `src/entrypoints/cli.tsx`,输出 `dist/cli.js` + chunk files。默认启用 `AGENT_TRIGGERS_REMOTE``CHICAGO_MCP``VOICE_MODE` feature。构建后自动替换 `import.meta.require` 为 Node.js 兼容版本(产物 bun/node 都可运行)。
55+
- **Dev mode**: `scripts/dev.ts` 通过 Bun `-d` flag 注入 `MACRO.*` defines,运行 `src/entrypoints/cli.tsx`。默认启用 `BUDDY``TRANSCRIPT_CLASSIFIER``BRIDGE_MODE``AGENT_TRIGGERS_REMOTE``CHICAGO_MCP``VOICE_MODE` 六个 feature。
5656
- **Module system**: ESM (`"type": "module"`), TSX with `react-jsx` transform.
5757
- **Monorepo**: Bun workspaces — internal packages live in `packages/` resolved via `workspace:*`.
5858
- **Lint/Format**: Biome (`biome.json`)。`bun run lint` / `bun run lint:fix` / `bun run format`
@@ -132,8 +132,8 @@ Feature flags control which functionality is enabled at runtime:
132132

133133
- **在代码中使用**: 统一通过 `import { feature } from 'bun:bundle'` 导入,调用 `feature('FLAG_NAME')` 返回 `boolean`**不要**`cli.tsx` 或其他文件里自己定义 `feature` 函数或覆盖这个 import。
134134
- **启用方式**: 通过环境变量 `FEATURE_<FLAG_NAME>=1`。例如 `FEATURE_BUDDY=1 bun run dev` 启用 BUDDY 功能。
135-
- **Dev 默认 features**: `BUDDY``TRANSCRIPT_CLASSIFIER``BRIDGE_MODE``AGENT_TRIGGERS_REMOTE`(见 `scripts/dev.ts`)。
136-
- **Build 默认 features**: `AGENT_TRIGGERS_REMOTE`(见 `build.ts`)。
135+
- **Dev 默认 features**: `BUDDY``TRANSCRIPT_CLASSIFIER``BRIDGE_MODE``AGENT_TRIGGERS_REMOTE``CHICAGO_MCP``VOICE_MODE`(见 `scripts/dev.ts`)。
136+
- **Build 默认 features**: `AGENT_TRIGGERS_REMOTE``CHICAGO_MCP``VOICE_MODE`(见 `build.ts`)。
137137
- **常见 flag**: `BUDDY`, `DAEMON`, `BRIDGE_MODE`, `BG_SESSIONS`, `PROACTIVE`, `KAIROS`, `VOICE_MODE`, `FORK_SUBAGENT`, `SSH_REMOTE`, `DIRECT_CONNECT`, `TEMPLATES`, `CHICAGO_MCP`, `BYOC_ENVIRONMENT_RUNNER`, `SELF_HOSTED_RUNNER`, `COORDINATOR_MODE`, `UDS_INBOX`, `LODESTONE`, `ABLATION_BASELINE` 等。
138138
- **类型声明**: `src/types/internal-modules.d.ts` 中声明了 `bun:bundle` 模块的 `feature` 函数签名。
139139

@@ -143,13 +143,45 @@ Feature flags control which functionality is enabled at runtime:
143143

144144
| Module | Status |
145145
|--------|--------|
146-
| Computer Use (`@ant/*`) | Stub packages in `packages/@ant/` |
147-
| `*-napi` packages (audio, image, url, modifiers) | Stubs in `packages/` (except `color-diff-napi` which is fully implemented) |
146+
| Computer Use (`@ant/*`) | Restored — `computer-use-swift`, `computer-use-input`, `computer-use-mcp`, `claude-for-chrome-mcp` 均有完整实现,macOS + Windows 可用,Linux 后端待完成 |
147+
| `*-napi` packages | `audio-capture-napi``image-processor-napi` 已恢复实现;`color-diff-napi` 完整实现;`url-handler-napi``modifiers-napi` 仍为 stub |
148+
| Voice Mode | Restored — `src/voice/``src/hooks/useVoiceIntegration.tsx``src/services/voiceStreamSTT.ts` 等,Push-to-Talk 语音输入(需 Anthropic OAuth) |
149+
| OpenAI 兼容层 | Restored — `src/services/api/openai/`,支持 Ollama/DeepSeek/vLLM 等任意 OpenAI 协议端点,通过 `CLAUDE_CODE_USE_OPENAI=1` 启用 |
148150
| Analytics / GrowthBook / Sentry | Empty implementations |
149-
| Magic Docs / Voice Mode / LSP Server | Removed |
151+
| Magic Docs / LSP Server | Removed |
150152
| Plugins / Marketplace | Removed |
151153
| MCP OAuth | Simplified |
152154

155+
### Computer Use
156+
157+
Feature flag `CHICAGO_MCP`,dev/build 默认启用。实现跨平台屏幕操控(macOS + Windows 可用,Linux 待完成)。
158+
159+
- **`packages/@ant/computer-use-mcp/`** — MCP server,注册截图/键鼠/剪贴板/应用管理工具
160+
- **`packages/@ant/computer-use-input/`** — 键鼠模拟,dispatcher + per-platform backend(`backends/darwin.ts``win32.ts``linux.ts`
161+
- **`packages/@ant/computer-use-swift/`** — 截图 + 应用管理,同样 dispatcher + per-platform backend
162+
- **`packages/@ant/claude-for-chrome-mcp/`** — Chrome 浏览器控制(独立于 Computer Use,通过 `--chrome` CLI 参数启用)
163+
164+
详见 `docs/features/computer-use.md`
165+
166+
### Voice Mode
167+
168+
Feature flag `VOICE_MODE`,dev/build 默认启用。Push-to-Talk 语音输入,音频通过 WebSocket 流式传输到 Anthropic STT(Nova 3)。需要 Anthropic OAuth(非 API key)。
169+
170+
- **`src/voice/voiceModeEnabled.ts`** — 三层门控(feature flag + GrowthBook + OAuth auth)
171+
- **`src/hooks/useVoice.ts`** — React hook 管理录音状态和 WebSocket 连接
172+
- **`src/services/voiceStreamSTT.ts`** — STT WebSocket 流式传输
173+
174+
详见 `docs/features/voice-mode.md`
175+
176+
### OpenAI 兼容层
177+
178+
通过 `CLAUDE_CODE_USE_OPENAI=1` 环境变量启用,支持任意 OpenAI Chat Completions 协议端点(Ollama、DeepSeek、vLLM 等)。流适配器模式:在 `queryModel()` 中将 Anthropic 格式请求转为 OpenAI 格式,再将 SSE 流转换回 `BetaRawMessageStreamEvent`,下游代码完全不改。
179+
180+
- **`src/services/api/openai/`** — client、消息/工具转换、流适配、模型映射
181+
- **`src/utils/model/providers.ts`** — 添加 `'openai'` provider 类型(最高优先级)
182+
183+
关键环境变量:`CLAUDE_CODE_USE_OPENAI``OPENAI_API_KEY``OPENAI_BASE_URL``OPENAI_MODEL``OPENAI_MODEL_MAP`。详见 `docs/plans/openai-compatibility.md`
184+
153185
### Key Type Files
154186

155187
- **`src/types/global.d.ts`** — Declares `MACRO`, `BUILD_TARGET`, `BUILD_ENV` and internal Anthropic-only identifiers.

DEV-LOG.md

Lines changed: 12 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -25,6 +25,18 @@
2525

2626
---
2727

28+
## Computer Use macOS 适配修复 (2026-04-04)
29+
30+
**分支**: `feature/computer-use/mac-support`
31+
32+
- **darwin.ts** — 应用枚举改用 Spotlight `mdfind` + `mdls`,获取真实 bundleId(旧方案合成 `com.app.xxx`),覆盖 `/Applications` + `/System/Applications` + CoreServices
33+
- **index.ts** — 新增 `hotkey` backend fallback,非原生模块不崩溃
34+
- **toolCalls.ts**`resolveRequestedApps()` 新增子串模糊匹配(`"Chrome"``"Google Chrome"`
35+
- **hostAdapter.ts**`ensureOsPermissions()` 检查 `cu.tcc` 存在性,跨平台 JS backend 安全降级
36+
- **测试**: 17 个 MCP 工具中 10 个完全通过,6 个在 full tier 应用上通过(IDE click tier 受限为预期行为),`screenshot` 未返回图片(疑似屏幕录制权限问题)
37+
38+
---
39+
2840
## Computer Use Windows 增强:窗口绑定截图 + UI Automation + OCR (2026-04-03)
2941

3042
在三平台基础实现之上,利用 Windows 原生 API 增强 Computer Use 的 Windows 专属能力。

README.md

Lines changed: 6 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -34,17 +34,18 @@
3434
- [x] 关闭自动更新;
3535
- [x] 添加自定义 sentry 错误上报支持 [文档](https://ccb.agent-aura.top/docs/internals/sentry-setup)
3636
- [x] 添加自定义 GrowthBook 支持 (GB 也是开源的, 现在你可以配置一个自定义的遥控平台) [文档](https://ccb.agent-aura.top/docs/internals/growthbook-adapter)
37-
- [x] 自定义 login 模式, 大家可以用这个配置 Claude 的模型!
37+
- [x] 自定义 login 模式, 大家可以用这个配置 Claude 的模型! [文档](https://ccb.agent-aura.top/docs/features/custom-platform-login)
38+
- [x] Remote Control / Bridge Mode 支持 [文档](https://ccb.agent-aura.top/docs/features/bridge-mode)
3839
- [x] 修复搜索工具的 rg 缺失问题(需要重新 bun i)
39-
- [x] OpenAI 接口兼容! /login 然后配置 OpenAI 平台即可!
40+
- [x] OpenAI 接口兼容! /login 然后配置 OpenAI 平台即可! [文档](https://ccb.agent-aura.top/docs/plans/openai-compatibility)
4041
- [x] Any Use
4142
- [x] 由于 Chrome Use 和 Computer Use 原本都是未完全验证的能力, 还是比较建议大家用社区里面的 MCP 支持
42-
- [x] Chrome use 支持 (浏览器插件要订阅权限 ) 感谢 @amDosion
43+
- [x] Chrome use 支持 (浏览器插件要订阅权限 ) 感谢 @amDosion [文档](https://ccb.agent-aura.top/docs/features/claude-in-chrome-mcp)
4344
- [x] 普通用户可以使用 [chrome-devtools-mcp](https://github.com/ChromeDevTools/chrome-devtools-mcp/) 替代, 比较不那么折腾
44-
- [x] Computer use 支持 感谢 @amDosion
45+
- [x] Computer use 支持 感谢 @amDosion [文档](https://ccb.agent-aura.top/docs/features/computer-use)
4546
- [x] Mac 上可以用这个项目 [computer-use-mcp](https://github.com/domdomegg/computer-use-mcp)
4647
- 注意这个库的命名方式与官方冲突了, 需要改为 `claude mcp add --scope user --transport stdio computer-use-mcp -- npx -y computer-use-mcp`
47-
- [x] /voice 支持 @amDosion
48+
- [x] /voice 支持 @amDosion [文档](https://ccb.agent-aura.top/docs/features/voice-mode)
4849
- [x] /dream 记忆整理命令(手动 + 自动后台触发) [文档](https://ccb.agent-aura.top/docs/features/auto-dream)
4950
- [ ] V6 大规模重构石山代码, 全面模块分包
5051
- [ ] V6 将会为全新分支, 届时 main 分支将会封存为历史版本

0 commit comments

Comments
 (0)