Skip to content

Latest commit

 

History

History
190 lines (143 loc) · 11.2 KB

File metadata and controls

190 lines (143 loc) · 11.2 KB

AgentOS

English | 繁體中文 | 日本語

iOS 16+ Swift 5.9+ Claude Opus 4 License: MIT GitHub Issues

iPhoneをAIエージェントホストに変える。 AgentOSは、Claude AIのフルツール呼び出し機能を備えたネイティブiOSアプリです。あなたのスマートフォンが自律的に見る・聞く・話す・閲覧する・コーディングする・取引する・通信することができます。

AgentOSとは?

AgentOSはiPhoneを強力なAIエージェントに変換します:

  • 見る — カメラ、フォトライブラリ、コンピュータビジョン、ARシーン分析
  • 聞く・話す — デバイス上の音声認識(Whisper)、音声合成(ElevenLabs)、音声チャンネル
  • 閲覧する — Web検索、ページ取得、クラウドブラウザ自動化(Browserbase)
  • コーディング — GitHubリポジトリ、ブランチ、PR、Issue、ファイル編集(10ツール)
  • 取引する — 台湾株、米国株、暗号資産のリアルタイム市況(11ツール)
  • 通信する — 10チャンネル:Telegram、Discord、LINE、WhatsApp、Slack、Teams、Matrix、Signal、音声、内蔵チャット
  • 記憶する — 基本+セマンティックベクター記憶、セッション間持続化
  • 自動化 — スケジュールタスク(cron)、バックグラウンド実行、マルチエージェントディスカッション
  • 創作する — DALL-E画像生成、HeyGen動画、Canvaデザイン
  • 管理する — Google Drive、Gmail、カレンダー、連絡先、写真、リマインダー、HomeKit、ヘルスケア

純粋なSwiftでClaude Messages APIを直接呼び出し — サブプロセス不要、ブリッジフレームワーク不要。

主要スペック

カテゴリ 数量 詳細
ネイティブツール 165+ 59ツールファイル(ハードウェア、クラウド、SNS、コーディング、市場データ)
AIエージェント 30 専門ペルソナ、各専用ダッシュボードUI付き
スマートスキル 34 軽量で組み合わせ可能な機能モジュール
通信チャンネル 10 内蔵、Telegram、Discord、LINE、WhatsApp、Slack、Teams、Matrix、Signal、音声
AIプロバイダー 5 Anthropic、z.ai、OpenRouter、Gemini、MLXローカル(オンデバイス)
MCPサーバー 動的 Streamable HTTPトランスポート(iOSネイティブ)
言語 3 English、繁體中文、日本語(リアルタイム切替)
Siriショートカット 11 音声起動6 + ショートカット専用インテント5
Swiftファイル 232+ 約76K行

AIエージェント

30のプリビルトエージェント、各専用ダッシュボードUI付き:

エージェント 機能
パーソナルアシスタント 汎用アシスタント — Web検索、メモ、日記、記憶
GitHub Agent 完全なコーディングワークフロー:計画 → コーディング → レビューパイプライン
マーケットAgent 台湾株/米国株 + 暗号資産リアルタイムデータ
Threads パブリッシャー Meta Threads:検索 → 執筆 → 分析(14ツール)
スケジュールマネージャー カレンダー、リマインダー、スケジュールタスク自動化
フォトマネージャー フォトライブラリ管理、ML搭載スマート検索
オートメーションAgent Cronジョブ、Webhook、マルチステップ自動化
クラウド開発Agent クラウドブラウザ + コード実行 + 画像生成
チャンネルハブ マルチチャンネル監視・応答
+ 21以上 ハードウェアAgent含む(BLE、NFC、AR、HomeKit、ヘルスケア、ミュージック、ナビゲーション)

5ステップ作成ウィザードで独自エージェントを作成、またはコミュニティエージェントを.agentpkgパッケージでインポート。

スマートスキル

34の組み合わせ可能なスキル、あらゆるエージェントを強化 — 専用UI不要:

スキル 説明
マーケットアナリスト 台湾株式市場分析
米国株アナリスト 米国株式市場データ(Polygon)
暗号資産アナリスト 暗号資産市場分析
Threads パブリッシャー Meta Threads SNS(14ツール)
コーディング GitHubコーディングワークフロー(10ツール)
ブレインストーマー クリエイティブなアイデア出し
プランナー プロジェクト・タスク計画
レビュアー コード・コンテンツレビュー
トランスレーター 多言語翻訳
ドキュメントプロセッサー 文書分析・処理
+ 24以上 SEO、メール、クラウドインフラ、セキュリティスキャン等

10の通信チャンネル

チャンネル フォアグラウンド バックグラウンド(常駐)
内蔵チャット ネイティブSwiftUI 常時利用可能
Telegram ロングポーリング APNsリレー
Discord WebSocket Gateway APNsリレー
LINE Webhook APNsリレー
WhatsApp Webhook APNsリレー
Slack WebSocket APNsリレー
Teams Webhook APNsリレー
Matrix Sync API APNsリレー
Signal Webhook APNsリレー
音声 デバイス上STT/TTS

常駐アーキテクチャ:Cloudflare Workerリレーサーバーが、APNsプッシュ通知を通じてバックグラウンドメッセージ処理を実現。アプリがサスペンド状態でも動作します。

5つのAIプロバイダー

プロバイダー モデル 用途
Anthropic Claude Opus 4 メイン(適応的思考、tool_use)
z.ai Claude via z.ai 代替エンドポイント
OpenRouter 複数モデル モデル多様性
Gemini Gemini Pro Google連携
MLXローカル Qwen3、Gemma、Llama オンデバイス推論(APIキー不要)

プロバイダー障害時に自動フェイルオーバー。

MCP連携

Streamable HTTPトランスポートで任意のModel Context Protocolサーバーと接続 — iOSで唯一使えるMCPトランスポート方式(サブプロセス起動不要)。

プリセットサーバー搭載。アプリ内MCP設定からカスタムサーバーを追加可能。

アーキテクチャ

┌──────────────────────────────────────────────────┐
│               AgentOS (iOS App)                  │
├───────────┬───────────┬────────────┬─────────────┤
│ チャンネル │ Agent     │   ツール    │    MCP      │
│ マネージャー│ エンジン  │ ディスパッチ │  クライアント │
│ (10ch)    │ (コア)    │ (165+)     │  (HTTP)     │
├───────────┴───────────┴────────────┴─────────────┤
│   Claude Messages API(Agentic tool_useループ)    │
├──────────────────────────────────────────────────┤
│  5 AIプロバイダー │ 常駐リレー(CF Worker)         │
├──────────────────┴───────────────────────────────┤
│  iOSハードウェア:カメラ、GPS、音声、BLE、NFC、AR   │
└──────────────────────────────────────────────────┘

Agenticループ:メッセージ → Claude API → tool_use? → ツール実行 → 結果追加 → end_turnまでループ。安全制限:1ターンあたり最大50回のツール呼び出し。

ツールHooks(安全レイヤー)

Hook 用途
ActivityLogHook 全ツール使用を監査ログとして記録
PrivacyHook 機密操作に明示的な許可を要求(Drive、Gmail、GitHub書き込み、連絡先、BLE、HomeKit)
ConstitutionHook Constitutional AIガードレール

プライバシーとセキュリティ

  • すべてのAPIキーはiOS Keychainに保存(平文やUserDefaultsには一切保存しない)
  • チャンネルホワイトリスト:明示的に許可されたチャットのみコマンド送信可能(デフォルト拒否)
  • MCP接続はHTTPSのみ
  • データ収集なし — すべてデバイス上に保持
  • 機密操作はPrivacyHookで制御(ユーザー承認が必要)
  • トークンバケットアルゴリズムによるレート制限
  • Telegram/Discord Webhook検証(Ed25519、HMAC-SHA256)

システム要件

  • iOS 16.0以降のiPhone
  • AIプロバイダーのAPIキー(少なくとも1つ):
    • Anthropic(推奨)
    • z.ai
    • OpenRouter
    • またはMLXローカルで完全オフライン推論(APIキー不要)
  • オプション:Telegram Bot Token、Discord Bot Token、LINE Channel Token等

問題の報告

バグの発見や機能のリクエストは、Issueを作成してください。

  • バグ報告:バグ報告テンプレートを使用 — iOSバージョン、再現手順、期待される動作と実際の動作を記載
  • 機能リクエスト:機能リクエストテンプレートを使用 — ユースケースを説明

コントリビュート

ガイドラインはCONTRIBUTING.mdをご覧ください。

セキュリティ

セキュリティ脆弱性についてはSECURITY.mdをご覧ください。セキュリティ脆弱性に関する公開Issueは作成しないでください

リンク

ライセンス

MIT License — 詳細はLICENSEをご覧ください。


SORAING CO., LTD.がClaudeで構築