Skip to content

royai-tw/voiceclaw

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 

Repository files navigation

VoiceClaw 🦞🎙️

用語音控制 OpenClaw — 支援 Apple Watch、iPhone、Siri Shortcuts

📖 專案目標

VoiceClaw 的目標是打造一個輕量級的語音控制層,讓使用者透過 Apple Watch、iPhone 或 Siri Shortcuts 快速向 OpenClaw 下達指令,無需打開電腦或手動輸入文字。

🎯 使用情境

情境一:Apple Watch 快速指令

Roy 正在開會,手腕上的 Apple Watch 震動提醒。他抬起手腕,對著手錶說:「幫我查一下今天的待辦事項」。幾秒後,OpenClaw 的回覆出現在手錶螢幕上。

情境二:iPhone Siri Shortcuts

開車途中,Roy 喊一聲「Hey Siri, 問 OpenClaw 明天有什麼會議」。Siri 透過 Shortcuts 將語音轉文字後送到 OpenClaw Gateway,回覆直接用語音朗讀出來。

情境三:運動中的快速記錄

跑步時突然想到一個好點子,Roy 對 Apple Watch 說:「記一下,Mai.today 要加入分帳功能」。OpenClaw 收到後自動記錄到對應的 Topic。

情境四:居家語音控制

在廚房做菜,雙手不方便操作手機。Roy 說:「OpenClaw,幫我把購物清單加上牛奶和雞蛋」。透過 iPhone 麥克風收音,即時處理。

🏗️ 基本架構

┌─────────────────┐     ┌──────────────────┐     ┌─────────────────┐
│  Apple Watch     │     │  iPhone           │     │  Siri Shortcuts │
│  watchOS App     │     │  iOS App / Widget │     │  Automations    │
└────────┬────────┘     └────────┬──────────┘     └────────┬────────┘
         │                       │                          │
         └───────────┬───────────┘──────────────────────────┘
                     │
                     ▼
         ┌───────────────────────┐
         │  VoiceClaw 中介層      │
         │  - 語音轉文字 (STT)    │
         │  - 指令解析            │
         │  - 回覆格式化          │
         └───────────┬───────────┘
                     │
                     ▼
         ┌───────────────────────┐
         │  OpenClaw Gateway     │
         │  - REST API / WebSocket│
         │  - Agent 處理          │
         │  - 回覆 TTS            │
         └───────────────────────┘

核心元件

  1. watchOS Companion App — Apple Watch 上的語音輸入介面,支援 Complication 快速啟動
  2. iOS Shortcuts Actions — 提供 Siri Shortcuts 整合,支援自動化流程
  3. VoiceClaw Bridge — 中介服務,處理 STT/TTS 轉換與 OpenClaw Gateway API 溝通
  4. OpenClaw Gateway 整合 — 利用 OpenClaw 現有的 Node 配對與 API 機制

🔗 相關資源與參考

OpenClaw 官方

類似專案參考

🛣️ 發展路線

Phase 1:Siri Shortcuts 整合(最小可行版本)

  • 建立 iOS Shortcuts Action,透過 OpenClaw Gateway API 發送文字指令
  • 支援語音輸入 → 文字 → OpenClaw → 回覆朗讀
  • 基本錯誤處理與離線提示

Phase 2:Apple Watch App

  • watchOS Companion App 基本 UI
  • 語音輸入與回覆顯示
  • Complication 支援(快速啟動)
  • 觸覺回饋(Haptic Feedback)

Phase 3:進階功能

  • 常用指令快捷按鈕(Apple Watch)
  • 對話歷史同步
  • Widget 支援(iPhone 主畫面)
  • 自動化情境觸發(到達某地點、特定時間)

🛠️ 技術棧

元件 技術
Apple Watch App SwiftUI + watchOS SDK
iPhone App SwiftUI + App Intents
Siri 整合 SiriKit / App Intents Framework
語音轉文字 Apple Speech Framework / Whisper
Gateway 通訊 REST API (HTTPS) / WebSocket
文字轉語音 AVSpeechSynthesizer / OpenClaw TTS

📄 授權

MIT License

🤝 貢獻

歡迎提交 Issue 和 Pull Request!這是一個開源專案,目標是讓 OpenClaw 的語音控制體驗更加便利。

About

用語音控制 OpenClaw — 支援 Apple Watch、iPhone、Siri Shortcuts 🦞🎙️

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors