用語音控制 OpenClaw — 支援 Apple Watch、iPhone、Siri Shortcuts
VoiceClaw 的目標是打造一個輕量級的語音控制層,讓使用者透過 Apple Watch、iPhone 或 Siri Shortcuts 快速向 OpenClaw 下達指令,無需打開電腦或手動輸入文字。
Roy 正在開會,手腕上的 Apple Watch 震動提醒。他抬起手腕,對著手錶說:「幫我查一下今天的待辦事項」。幾秒後,OpenClaw 的回覆出現在手錶螢幕上。
開車途中,Roy 喊一聲「Hey Siri, 問 OpenClaw 明天有什麼會議」。Siri 透過 Shortcuts 將語音轉文字後送到 OpenClaw Gateway,回覆直接用語音朗讀出來。
跑步時突然想到一個好點子,Roy 對 Apple Watch 說:「記一下,Mai.today 要加入分帳功能」。OpenClaw 收到後自動記錄到對應的 Topic。
在廚房做菜,雙手不方便操作手機。Roy 說:「OpenClaw,幫我把購物清單加上牛奶和雞蛋」。透過 iPhone 麥克風收音,即時處理。
┌─────────────────┐ ┌──────────────────┐ ┌─────────────────┐
│ Apple Watch │ │ iPhone │ │ Siri Shortcuts │
│ watchOS App │ │ iOS App / Widget │ │ Automations │
└────────┬────────┘ └────────┬──────────┘ └────────┬────────┘
│ │ │
└───────────┬───────────┘──────────────────────────┘
│
▼
┌───────────────────────┐
│ VoiceClaw 中介層 │
│ - 語音轉文字 (STT) │
│ - 指令解析 │
│ - 回覆格式化 │
└───────────┬───────────┘
│
▼
┌───────────────────────┐
│ OpenClaw Gateway │
│ - REST API / WebSocket│
│ - Agent 處理 │
│ - 回覆 TTS │
└───────────────────────┘
- watchOS Companion App — Apple Watch 上的語音輸入介面,支援 Complication 快速啟動
- iOS Shortcuts Actions — 提供 Siri Shortcuts 整合,支援自動化流程
- VoiceClaw Bridge — 中介服務,處理 STT/TTS 轉換與 OpenClaw Gateway API 溝通
- OpenClaw Gateway 整合 — 利用 OpenClaw 現有的 Node 配對與 API 機制
- OpenClaw GitHub — 主專案(iOS Node 已支援 Voice Wake、Talk Mode)
- PR #9456: Siri Neural Voice for Talk Mode — macOS Siri 語音支援
- PR #12157: Meeting Notes with Live Transcription — 即時語音轉錄功能
- Issue #6142: Discord Voice Channel Support — 語音頻道整合需求
- openclaw-coolify — iPhone PWA + 語音控制參考
- Home Assistant iOS — Siri Shortcuts 整合智慧家庭的成熟範例
- Apple SiriKit / App Intents — Apple 官方語音整合框架
- 建立 iOS Shortcuts Action,透過 OpenClaw Gateway API 發送文字指令
- 支援語音輸入 → 文字 → OpenClaw → 回覆朗讀
- 基本錯誤處理與離線提示
- watchOS Companion App 基本 UI
- 語音輸入與回覆顯示
- Complication 支援(快速啟動)
- 觸覺回饋(Haptic Feedback)
- 常用指令快捷按鈕(Apple Watch)
- 對話歷史同步
- Widget 支援(iPhone 主畫面)
- 自動化情境觸發(到達某地點、特定時間)
| 元件 | 技術 |
|---|---|
| Apple Watch App | SwiftUI + watchOS SDK |
| iPhone App | SwiftUI + App Intents |
| Siri 整合 | SiriKit / App Intents Framework |
| 語音轉文字 | Apple Speech Framework / Whisper |
| Gateway 通訊 | REST API (HTTPS) / WebSocket |
| 文字轉語音 | AVSpeechSynthesizer / OpenClaw TTS |
MIT License
歡迎提交 Issue 和 Pull Request!這是一個開源專案,目標是讓 OpenClaw 的語音控制體驗更加便利。