rlaope · rlaope · Apr 9, 2026 · Apr 9, 2026 · Apr 9, 2026
@@ -1,132 +1,143 @@
 # bestwork-agent
 
-Claude Codeのための最高のハーネスエンジニアリング。サークルではなく企業のように働く。
+Claude Codeのためのハーネスエンジニアリング。プロンプト一行で十分 — 残りはハーネスがキャッチします。
 
 <p align="center">
   <a href="README.md">English</a> · <a href="README.ko.md">한국어</a> · <a href="README.ja.md">日本語</a>
 </p>
 
 ---
 
-AIエージェントは一人で作業します。ハルシネーション、ループ、要件の見落とし — 終わってから気づきます。
+## 問題
 
-**bestwork-agent**はエージェントをチームに変えます。すべてのタスクに**Tech**（エンジニア）+ **PM**（プロダクトマネージャー）+ **Critic**（品質レビュアー）が割り当てられます。49の専門エージェント。自動選択。並列実行。フィードバックループ。リアルタイム通知。
+AIコーディングエージェントはハルシネーション、ループ、要件漏れ、セキュリティ欠陥を生み出します。AI生成コードの45%に脆弱性が含まれています（Veracode）。バイブコーディングアプリはアイデア検証なしで作られ、失敗します。
 
-## インストール
+**bestwork-agent**はプロのエンジニアリングチームが使う品質ゲートを追加します — 作業方法は変えずに。
 
-### 方法1: Claude Codeプラグイン（推奨）
+## ベンチマーク：ハーネスON vs OFF
 
 ```
-/plugin marketplace add https://github.com/rlaope/bestwork-agent
-/plugin install bestwork-agent
+═══════════════════════════════════
+  HARNESS EFFECTIVENESS BENCHMARK
+═══════════════════════════════════
+
+  シナリオ:      13
+  精度:          100.0%
+
+  ハーネスON:
+    キャッチ率:   100% (10/10)
+    誤検出:       0
+
+  ハーネスOFF (バニラ):
+    キャッチ率:   0% (0/10)
+
+  カテゴリ:
+    ハルシネーション 3/4 キャッチ
+    プラットフォーム 4/4 キャッチ
+    非推奨         1/1 キャッチ
+    セキュリティ    1/1 キャッチ
+═══════════════════════════════════
 ```
 
-### 方法2: npm
+自分で実行: `npm run benchmark`
 
-```bash
-npm install -g bestwork-agent
-bestwork install
-```
+## ハーネスの機能
 
-Claude Codeを再起動後、`./help`を入力。
+| ゲート | タイミング | キャッチ対象 |
+|--------|-----------|-------------|
+| **グラウンディング** | PreToolUse (Edit/Write) | 未読ファイルの編集 |
+| **スコープロック** | PreToolUse | ロックディレクトリ外の編集 |
+| **ストリクト** | PreToolUse | `rm -rf`、`git push --force` |
+| **タイプチェック** | PostToolUse (Edit/Write) | 変更後のTypeScriptエラー |
+| **レビュー** | オンデマンド / PostToolUse | 偽import、ハルシネーションメソッド、プラットフォーム不一致 |
+| **要件チェック** | PostToolUse (Edit/Write) | clarify/validateセッションの未達要件 |
+| **検証** | ビルド前 | エビデンスベースのgo/no-go — この機能は作る価値があるか？ |
 
----
+すべてのゲートは自動実行されます。プロンプトを入力するだけです。
 
-## ハーネス
+## インストール
 
-### トリオ実行 — AI企業
+### 方法1: Claude Codeプラグイン（推奨）
 
+```bash
+/plugin marketplace add https://github.com/rlaope/bestwork-agent
+/plugin install bestwork-agent
 ```
-./trio implement auth API | add rate limiting | write integration tests
-```
-
-各タスクにドメイン専門家トリオを自動マッチング：
-
-- **Tech** — ドメイン専門知識で実装
-- **PM** — 要件充足を検証
-- **Critic** — 品質レビュー + ハルシネーション検出
-- 却下？フィードバックループ → Tech修正 → 再レビュー（最大3回）
 
-### 49の専門エージェント
+### 方法2: npm
 
 ```bash
-bestwork agents    # フルカタログ
+npm install -g bestwork-agent
+bestwork install
 ```
 
-**25 Tech**: backend, frontend, fullstack, infra, database, API, mobile, testing, security, performance, devops, data, ML, CLI, realtime, auth, migration, config, agent-engineer, plugin, accessibility, i18n, graphql, monorepo, writer
+## 仕組み
 
-**10 PM**: product, API, platform, data, infra, migration, security, growth, compliance, DX
+ゲートウェイがプロンプトを分析し、適切なスケールを選択します：
 
-**14 Critic**: performance, scalability, security, consistency, reliability, testing, hallucination, DX, type safety, cost, accessibility, devsecops, i18n, agent
+- **Solo** — 簡単な修正（エージェント1名）
+- **Pair** — 関連する2タスク（エージェント2名 + クリティック）
+- **Trio** — 品質ゲート付き複数タスク（タスクごとにtech + PM + critic）
+- **Hierarchy** — 大規模、アーキテクチャ決定（CTO → Lead → Senior → Junior）
+- **Squad** — ローカル機能、高速コンセンサス（フラット、並列）
 
-### 開発コントロール
+## 49ドメインスペシャリスト
 
-| コマンド | 説明 |
-|----------|------|
-| `./scope src/auth/` | ディレクトリへの編集をロック |
-| `./unlock` | スコープロック解除 |
-| `./strict` | 全ガードレール有効化 |
-| `./relax` | ストリクトモード無効化 |
-| `./tdd add auth` | TDD（テスト駆動開発）フロー |
-| `./context [files]` | ファイルコンテキストプリロード |
-| `./recover` | 行き詰まり？アプローチリセット |
-| `./review` | プラットフォーム/ランタイムのハルシネーションチェック |
+**25 Tech** · **10 PM** · **14 Critic**
 
-### スマートゲートウェイ
+エージェントプロンプトは`prompts/`にあり、ビルドなしで編集可能。
 
-コマンドの暗記不要。自然言語で入力：
+## 22スキル
 
-```
-"review my code"           → ./review
-"run in parallel"          → ./trio
-"why did it fail"          → ./autopsy
-"improve my prompts"       → ./learn
-```
+自然言語またはスラッシュコマンド — ゲートウェイが自動ルーティング。
 
-### 通知
+| スキル | 機能 |
+|--------|------|
+| `validate` | ビルド前のエビデンスベース機能検証 |
+| `clarify` | 実行前の要件質問 |
+| `review` | ハルシネーション + プラットフォーム不一致スキャン |
+| `trio` | 品質ゲート付き並列実行 |
+| `plan` | スコープ分析 + チーム推薦 |
+| `delegate` | 確認なしの自律実行 |
+| `deliver` | 完了まで繰り返し実行 |
+| `blitz` | 最大並列バースト |
+| `doctor` | デプロイ設定 vs コード整合性チェック |
+| `pipeline-run` | GitHub Issue一括自動処理 |
+| `superthinking` | 1000回反復思考シミュレーション |
+| `waterfall` | ゲート付き順次ステージ処理 |
 
-```
-./discord <webhook_url>
-./slack <webhook_url>
-```
+他10スキル: agents, changelog, docs, health, install, meetings, onboard, sessions, status, update.
 
-### ハルシネーション防止（自動）
+## ハーネスコントロール
 
-- **グラウンディング** — 未読ファイルの編集時に警告
-- **バリデーション** — コード変更ごとに自動タイプチェック
-- **プラットフォームレビュー** — セッション終了時にOS/ランタイム不一致を検出
-- **スコープ強制** — ロックされたパス外の編集をブロック
-- **ストリクト強制** — `rm -rf`、`git push --force` をブロック
-
----
+```
+./scope src/auth/       ディレクトリロック
+./unlock                ロック解除
+./strict                rm -rf ブロック、読み取り強制
+./relax                 ストリクト解除
+./tdd add user auth     TDD（テスト駆動開発）フロー
+./review                ハルシネーションスキャン
+./validate              この機能は作る価値があるか？
+./clarify               要件確認
+```
 
 ## オブザーバビリティ
 
 ```bash
 bestwork                  # TUIダッシュボード
 bestwork sessions         # セッション一覧
-bestwork session <id>     # ツール使用分布、エージェントツリー
-bestwork summary -w       # 週間概要
 bestwork heatmap          # 365日アクティビティグリッド
-bestwork loops            # エージェントループ検出
+bestwork loops            # ループ検出
 bestwork replay <id>      # セッションリプレイ
-bestwork effectiveness    # プロンプト効率トレンド
-bestwork outcome <id>     # 生産性判定
-bestwork export -f csv    # データエクスポート
 ```
 
-### データ駆動エージェント
+## 通知
 
 ```
-./autopsy [id]         セッション事後分析 — なぜ苦戦したか？
-./learn                プロンプティングルール抽出
-./predict <task>       過去セッションから複雑度を推定
-./guard                現在のセッション健全性チェック
-./compare <id1> <id2>  セッション比較
+./discord <webhook_url>
+./slack <webhook_url>
 ```
 
----
-
 ## セキュリティ
 
 すべてのデータはローカル。外部送信なし。[SECURITY.md](SECURITY.md)参照。