- 코드 품질을 타협하지 않습니다 — 19단계 파이프라인이 범위 검증부터 프로덕션 준비까지 모든 단계를 강제합니다
- 혼자 리뷰하지 않습니다 — 5개 도메인팀, 22명의 전문가가 팀 내 토론과 합의로 우려사항을 도출합니다
- 실패해도 포기하지 않습니다 — grind 모드는 자동 진단, 전략 전환, 체크포인트 롤백으로 끝까지 해결합니다
- 안전하게 격리됩니다 — 모든 작업은 독립 worktree에서 실행되고, TDD가 필수이며, 파괴적 명령은 차단됩니다
- 진행 상태를 잃지 않습니다 — State-Driven Execution으로 매 턴마다 workflow-state.json에서 정확한 Step 위치를 복원합니다
- 합리화를 스스로 차단합니다 — Anti-Rationalization Tables와 Red Flags가 잘못된 지름길(Step 건너뛰기, 임의 해석, 미검증 진행)을 구조적으로 탐지합니다
git clone https://github.com/SW-in-beta/simon
cd simon
./install.shClaude Code에서 바로 사용하세요:
/simon implement user authentication with JWT
graph LR
A["Step 0-4B<br>계획 & 전문가 사전 리뷰"] --> B["Step 5<br>TDD 구현"]
B --> C["Step 6-17<br>검증 & 리팩토링"]
C --> D["Step 18-19<br>보고서 & PR"]
style A fill:#e8f4f8,stroke:#2196f3
style B fill:#e8f5e9,stroke:#4caf50
style C fill:#fff3e0,stroke:#ff9800
style D fill:#f3e5f5,stroke:#9c27b0
Phase A — git 이력 기반 Codebase Health Pre-scan, 기존 코드 분석, 인터뷰, 계획 수립, 전문가 팀 사전 리뷰 (대화형)
Phase B-E — TDD 구현, 5개 팀 검증, 리팩토링, 회귀 테스트 (자율 실행)
마무리 — 인터랙티브 가이드 리뷰, 성공 기준 체크리스트 검증, PR 생성
신뢰도(Reliability)가 최우선 — 토큰 사용량이나 비용보다 결과의 정확성이 중요합니다.
| 패턴 | 언제 사용 | 핵심 원리 |
|---|---|---|
| Agent Team (공유 컨텍스트) | 서로 다른 관점의 에이전트가 토론으로 합의를 도출할 때 | Six Thinking Hats — 각 에이전트가 고유 관점에서 논쟁하여 더 나은 결론 도출 |
| SubAgent (독립 컨텍스트) | 독립적인 분석이 수렴하여 신뢰도를 높일 때 | Monte Carlo — 독립 시행의 수렴이 개별 분석보다 높은 신뢰도 보장 |
판단 기준: "에이전트들이 서로의 출력을 보면 더 나은 결과가 나오는가?"
- YES → Agent Team (토론의 가치 > 독립성 손실) — 계획 수립, 설계 토론에 적합
- NO → SubAgent (독립성의 가치 > 토론 부재) — 검증, 감사, 병렬 실행에 적합
검증/감사 단계에서 Agent Team의 의견 교환은 확증 편향(confirmation bias)의 경로가 됩니다. 검증이 목적인 단계에서는 SubAgent로 독립성을 구조적으로 보장합니다.
에이전트 프롬프트 구조: subagent/Agent Team 멤버에게 역할을 전달할 때 XML 태그(<role>, <context>, <instructions>)로 구조화합니다. compaction 시 역할/맥락/지시가 섞여 손실되는 것을 방지하며, 핵심 지시는 <instructions> 시작 부분에 배치합니다.
| 스킬 | 설명 |
|---|---|
/simon |
19단계 심층 워크플로우 — 계획, 구현, 검증을 최고 수준의 엄밀함으로 수행 |
/simon-grind |
열일모드 — 재시도 한계 10, 자동 진단/복구/전략 전환 |
/simon-pm |
프로젝트 매니저 — PRD 기반 전체 앱 기획, simon 인스턴스에 작업 분배 |
/simon-code-review |
PR 기반 코드 리뷰 — Draft PR 생성, 인라인 리뷰 코멘트, CI Watch, 피드백 루프 |
/simon-sessions |
세션 관리 — worktree 기반 작업 세션 조회, 이어서 작업, 삭제 |
/simon-report |
사전 분석 보고서 — 전문가 팀 토론을 통한 RFC, 현황 분석, 커스텀 포맷 |
/simon-auto-boost |
자동 웹 검색 기반 스킬 개선 — 최신 AI 코딩 에이전트 best practices를 검색하여 스킬 자동 개선 |
/simon-boost |
외부 리소스 분석 — 링크를 읽고 스킬 개선을 제안 |
/simon-boost-capture |
작업 중 스킬 개선점 백그라운드 캡처 — 작업 흐름을 멈추지 않고 인사이트 기록 |
/simon-boost-review |
축적된 개선 인사이트 리뷰 & 적용 — 캡처된 개선안을 검토하고 스킬에 반영 |
/simon-brain-query |
개인 지식베이스 검색 — Obsidian wiki vault를 통합 검색하여 사전 지식으로 답변 |
/simon-brain-update |
지식베이스 업데이트 — MD 파일을 적합한 vault에 자동 분류하고 wiki로 정리 |
/simon-ci-fix |
CI 실패 자동 수정 — 로그 분석, 에러 분류, 코드 수정, 푸시를 최대 5 사이클 반복 |
/simon-company |
풀스택 소프트웨어 회사 — 다중 전문 팀 협업으로 기획부터 배포·운영까지 완성 |
/simon-healthcheck |
스킬 건강 상태 대시보드 — simon 패밀리 전체의 구조적 품질 검증 및 리포트 |
/simon-md-reviewer |
마크다운 파일을 HTML 뷰어로 열어 인라인 코멘트 기반 리뷰·수정 루프 실행 |
/simon-monitor |
워크플로 실시간 시각화 — simon/grind/pm 파이프라인의 모든 단계를 웹 대시보드로 추적 |
/simon-oncall |
온콜 문의 분석 — 슬랙 메시지와 관련 레포를 심층 분석하여 원인·해결책·답변 초안 제공 |
/simon-presenter |
라이브 데모 프레젠터 — Playwright로 앱을 실제 구동하며 인터랙티브 시연 |
/simon-publish |
Confluence 자동 게시 — MD 파일을 개인 워크스페이스에 카테고리 자동 분류 후 게시 |
/simon-study |
문제 기반 심층 학습 — 문제에서 출발하여 개념·코드·트레이드오프를 하나의 보고서로 학습 |
/simon-web-search |
웹 딥 리서치 — 질문 분해 → 멀티패스 병렬 검색 → 소스 교차검증 → 신뢰도 명시 보고서 생성 |
| 상황 | 스킬 |
|---|---|
| 기능 구현 또는 버그 수정 | /simon |
| 실패하면 안 되는 복잡한 코드베이스 | /simon-grind |
| 전체 앱 빌드 또는 멀티 피처 프로젝트 | /simon-pm |
| 대규모 풀스택 서비스 (다중 팀 협업) | /simon-company |
| 작업 완료 후 PR + 코드 리뷰 | /simon-code-review |
| 이전 작업 세션 이어서 하기 | /simon-sessions |
| RFC, 아키텍처 분석, 보고서 (코드 변경 없음) | /simon-report |
| 유용한 아티클/레포 발견 — 스킬 개선 | /simon-boost |
| 최신 트렌드 자동 검색 — 스킬 자동 개선 | /simon-auto-boost |
| 작업 중 스킬 개선점 메모 (작업 흐름 유지) | /simon-boost-capture |
| 축적된 개선안 일괄 검토 & 적용 | /simon-boost-review |
| 내 위키/지식베이스에서 검색 | /simon-brain-query |
| 분석 결과를 지식베이스에 저장 | /simon-brain-update |
| CI 실패 자동 수정 (PR checks 실패) | /simon-ci-fix |
| 스킬 파일 수정 후 품질 검증 | /simon-healthcheck |
| MD 파일을 브라우저 뷰어로 리뷰 | /simon-md-reviewer |
| simon 워크플로 진행 상황 실시간 확인 | /simon-monitor |
| 온콜 문의 원인 파악 & 답변 작성 | /simon-oncall |
| 완성된 앱 라이브 데모 시연 | /simon-presenter |
| 분석 보고서를 Confluence에 게시 | /simon-publish |
| 문제 기반으로 개념부터 깊이 학습 | /simon-study |
| 기술 주제 딥 리서치 & 분석 보고서 | /simon-web-search |
전문가 팀 구조 (5개 도메인팀, 22명)
전문가들은 개별 리뷰가 아닌 팀 내 토론을 통해 합의 기반으로 우려사항을 도출합니다.
| 팀 | 멤버 | 활성화 | 토론 초점 |
|---|---|---|---|
| Safety | appsec, auth, infrasec, stability | 항상 (appsec+stability) | 보안 경계, 인증 우회, 장애 복구 |
| Code Design | convention, idiom, design-pattern, testability | 항상 (convention+idiom) | 레포 컨벤션, 언어 관용구, 설계 패턴, 테스트 가능성 |
| Data | rdbms, cache, nosql | auto-detect (min 2) | 데이터 일관성, 캐시 무효화, 스토리지 정합성 |
| Integration | sync-api, async, external-integration, messaging | auto-detect (min 2) | 동기/비동기 경계, 에러 전파, 장애 격리 |
| Ops | infra, observability, performance, concurrency | auto-detect (min 2) | 운영 안정성, 관측 가능성, 성능 |
simon-grind 상세
simon을 최대 집요함으로 확장합니다:
- 모든 재시도 한계 = 10 — 쉽게 포기하지 않습니다
- 에스컬레이션 래더 — 단순 수정 → 근본 원인 분석 → 전략 전환 → 최후의 수단
- 자동 진단 — 실패 추적, 패턴 감지, 전략 전환
- 체크포인트 정책 — 티어 경계(Attempt 3→4, 6→7) 자동 체크포인트, 진전 시 best 태그, 전략 전환 시 best로 롤백
- 진행 감지 — 2회 연속 정체 시 즉시 전략 전환
- Hypothesis Reset Protocol — 동일 에러 3회 반복 감지 시 현재 가설의 근본 가정을 의심하고 대안 가설 2개 이상 도출. "열심히 했지만 같은 방법을 10번 시도한 것" 방지
- Cross-Step Compounding Failure 감지 — 동일 파일이 3개 이상 Step에서 반복 실패 시 기초 설계 결정 재검토
- Architecture Sanity Check — Step 8 이후 전체 diff의 아키텍처 일관성 1-pass 검증 (STANDARD+ 경로)
- 총 재시도 예산 — 전체 50회, 70% 도달 시 경고
- 레퍼런스 지연 로딩 — Startup/Phase 진입/에러 발생 시점에 필요한 파일만 로딩
- 신뢰도 점수 — 모든 에이전트 출력에 신뢰도 + 영향도 태깅
simon-pm 상세
7단계 프로젝트 매니저 파이프라인:
| 단계 | 이름 | 역할 |
|---|---|---|
| 0 | Project Setup | 프로젝트 유형 감지, 실행 모드 선택 |
| 1 | Spec-Driven Design | 인터뷰 → Spec(WHAT) → Architecture(HOW) → PRD |
| 2 | Task Breakdown | PRD → 기능 분해 → 의존성 그래프 → 실행 계획 |
| 3 | Environment Setup | 스캐폴딩, 의존성, 설정 |
| 4 | Feature Execution | simon/grind 인스턴스에 기능 분배 (가능한 경우 병렬) |
| 5 | Full Verification | 통합 테스트, 아키텍처 리뷰, 보안 리뷰 |
| 6 | Delivery | 최종 보고서, 가이드 리뷰, PR 생성 |
복잡도에 따라 simon 또는 simon-grind를 자동 할당합니다.
Phase 4 진입 시 PM은 Phase 1-3의 과정을 컨텍스트에서 제거하고 결과물만 로딩하여 컨텍스트 효율을 최적화합니다.
simon-code-review 상세
작업 완료 후 PR 생성과 코드 리뷰를 수행합니다:
- Draft PR 생성 — 변경사항 분석 기반 PR 자동 생성 + Review Guide 섹션 포함
- Blind-First 2-Pass 리뷰 — review-sequence.md에 anchoring되지 않도록 diff만으로 먼저 분석 후 대조. 독립 severity 판정 후 구현자 판정과 불일치 시
[SEVERITY-DISPUTED]태깅 - 기존 패턴 스캔 — diff에 도입된 새 패턴에 대해 코드베이스 내 기존 대안을 능동적으로 탐색
- 공식 문서 검증 — 사용된 API/패턴을 공식 문서(context7 MCP, WebSearch)로 fact-check하여 deprecated API, anti-pattern 사전 식별
- 영향 분석 Pass — 변경되지 않았지만 영향받을 수 있는 코드를 1-depth 탐색하여 인라인 코멘트 작성
- Architecture Impact — Review Summary에 의존성 방향, 모듈 경계, 확장성, 데이터 흐름 관점의 아키텍처 영향 분석 포함 (STANDARD+ 경로)
- 대규모 PR 처리 — 100+ 파일 PR은 Core/Support/Generated로 분류, 핵심 파일에 80% 집중
- CI Watch — CI 모니터링 + 실패 자동 수정을 simon-ci-fix에 위임 (에러 분류→진단→수정→푸시, 최대 5 cycles)
- Comment Auto-Watch — 1분 간격 PR 댓글 자동 감지, 새 피드백 즉시 반영
- 전문가 검증 피드백 루프 — 사용자 코멘트에 대해 도메인 전문가 Agent를 호출하여 검증 후 처리 (AGREE/PARTIAL/COUNTER verdict, Self-Agreement Bias 견제 포함)
- 중단 복구 프로토콜 — push 실패, API 오류 등으로 중단 시 잔여 워크플로를 자동 재개. 인라인 리뷰 누락 방지
- 피드백 루프 — 코드 수정 → 커밋 → 인라인 리뷰 재작성 → CI 재확인
STANDALONE 모드에서는 3개 Agent Team(architect, writer, impact-analyzer)이 병렬 분석하여 review-sequence를 자체 생성합니다.
simon-company 상세
대규모 풀스택 서비스를 다중 전문 팀(PM, Design, Frontend, Backend, QA, DBA, DevOps, ML)이 협업하여 완성합니다:
- 의뢰 모드 — 불명확한 아이디어를 구조화된 인터뷰로 구체화
- Scope Guard — 소규모 프로젝트는 simon-pm으로 자동 리다이렉트
- 전체 라이프사이클 — 기획 → 디자인 → 개발 → QA → 배포 → 운영
- 명시적 호출 전용 (
/simon-company)
simon-presenter 상세
완성된 앱을 Playwright headed 브라우저로 실제 구동하며 인터랙티브하게 시연합니다:
- 유저스토리 기반 시나리오로 앱의 핵심 기능 시연
- 실제 브라우저 조작으로 동작 검증
- 이해관계자에게 보여주기 위한 프레젠테이션 모드
기타 스킬 상세 (report / boost 패밀리 / brain 패밀리 / sessions / 기타)
simon-report — 코드 변경 없이 구현 전 분석 문서(RFC, 현황 분석, 커스텀 포맷)를 생성합니다. simon과 동일한 5개 도메인 전문가 팀 토론 구조를 사용하며, git 이력 기반 Codebase Health Assessment(고churn 파일, bug hotspot, firefighting 빈도 등 정량 진단)를 포함하여 의사결정 근거를 강화합니다. graphify 통합: graphify-out/ 그래프가 존재하면 god nodes/communities로 전체 구조를 선파악하고 분석 범위를 최적화합니다. 리뷰 후 simon / simon-pm으로 원활하게 핸드오프할 수 있습니다.
simon-auto-boost — Claude Code 공식 문서, Hacker News, Medium, YouTube 등에서 최신 AI 코딩 에이전트 best practices를 자동 검색하고, 6인 전문가 패널 분석 → 사용자 승인 → 적용 → 스킬 가이드라인 검증 → 스모크 테스트까지 수행합니다. 마지막 검색 시점을 기록하여 이후 콘텐츠만 처리합니다.
simon-boost — 외부 리소스(블로그, GitHub, 논문)를 읽고 6인 전문가 패널이 스킬 개선을 제안합니다. 모든 제안은 적용 전 명시적 승인이 필요하며 .claude/boost/applied-log.md에 기록됩니다.
simon-boost-capture — 작업 중 발견한 스킬 개선점을 백그라운드로 분석·기록합니다. 작업 흐름을 멈추지 않고 인사이트를 캡처하여 나중에 일괄 처리할 수 있습니다.
simon-boost-review — simon-boost-capture로 축적된 개선 인사이트를 검토하고 실제 스킬에 반영합니다. 캡처된 개선안을 모아서 한번에 처리할 때 사용합니다.
simon-brain-query — ~/Obsidian/*-wiki/ 패턴으로 vault를 동적 감지하고 통합 검색합니다. INDEX.md/TAGS.md 빠른 매칭과 ripgrep 심층 검색을 조합하며, 크로스-vault 연결을 명시합니다. 다른 스킬(simon-oncall, simon-study 등)이 사전 지식 조회에 활용하는 공통 검색 로직이기도 합니다.
simon-brain-update — 분석 결과물(MD 파일)을 Obsidian wiki vault에 정리합니다. vault의 CLAUDE.md를 읽어 도메인을 파악하고 적합한 vault와 카테고리를 자동 판별합니다. 기존 wiki와 충돌하는 내용은 사용자에게 확인 후 처리하며, 인덱싱(INDEX.md, TAGS.md, GRAPH.md)은 스크립트로 자동 갱신합니다.
simon-ci-fix — PR의 CI 체크를 모니터링하고 실패 시 자동으로 수정합니다. 에러 유형별 전문 복구 전략으로 최대 5회 사이클(로그 분석→에러 분류→코드 수정→푸시→재확인)을 반복합니다. simon-code-review의 CI Watch 단계에서 자동 호출되거나, 독립 실행도 가능합니다.
simon-healthcheck — simon 패밀리 전체 스킬의 구조적 품질을 검증하고 대시보드로 출력합니다. boost 적용 후 품질 확인, 스킬 파일 수정 후 무결성 검증에 사용합니다.
simon-md-reviewer — 마크다운 파일을 HTML 뷰어로 브라우저에서 열고, 인라인 코멘트 기반 리뷰·수정 루프를 실행합니다. 확정 후 simon-publish로 Confluence 게시를 이어서 진행할 수 있습니다.
simon-monitor — simon/grind/pm 워크플로의 실행 과정을 웹 대시보드(포트 3847)로 실시간 시각화합니다. 전문가 패널 의견, 서브에이전트 호출/결과, 의사결정 근거, 게이트 통과/실패를 시각적으로 확인합니다. 완료된 세션의 이력 리뷰도 지원합니다.
simon-oncall — 슬랙 메시지 URL과 관련 레포를 입력받아 온콜 문의를 분석합니다. 코드·사내 자료를 심층 분석(simon-study 활용)하여 원인 진단, 해결책, 슬랙 답변 초안을 제공합니다.
simon-publish — simon-md-reviewer로 확정된 MD(또는 임의의 MD 파일)를 Confluence 개인 워크스페이스에 게시합니다. 콘텐츠를 분석하여 카테고리를 자동 분류하고, 중복 페이지 감지 후 업데이트 또는 신규 생성을 선택합니다.
simon-study — 구체적인 문제에서 출발하여 관련 개념 이해, 코드 분석, 설계 트레이드오프, 개선 방향까지 하나의 보고서로 학습합니다. simon-brain-query로 사전 지식을 조회하고, 결과는 simon-brain-update로 지식베이스에 저장할 수 있습니다.
simon-sync — simon-* 스킬 파일의 변경사항을 ~/simon-skills 오픈소스 레포에 동기화합니다. PostToolUse 훅이 ~/.claude/skills/simon-* 파일 변경을 감지하면 Stop 훅이 자동 트리거하며, 10분 쿨다운으로 연속 수정 시 불필요한 반복을 방지합니다. 수동 호출(/simon-sync)도 가능합니다.
simon-sessions — 여러 Claude Code 세션에 걸친 worktree 기반 작업을 관리합니다: list | search <keyword> | info <branch> | resume <branch> | delete <branch> | pr <branch>. search 명령으로 키워드 기반 세션 검색(브랜치명, 커밋 메시지, CONTEXT.md)이 가능합니다. resume 시 상태 기반 Recommended Action을 제시합니다.
simon-web-search — 기술 주제 딥 리서치 스킬. 질문을 서브토픽으로 분해하고 멀티패스 병렬 검색으로 정보를 수집한 뒤, 소스 교차검증과 [미확인]/[추정] 신뢰도 표시 체계로 구조화 보고서를 생성합니다. quick(단일 패스) / standard(2-3 라운드) / deep(3-5 라운드) 깊이 옵션을 지원하며, 모든 주장은 URL과 신뢰도(HIGH/MEDIUM/LOW)를 명시합니다.
설정 (config.yaml)
model_policy: opus # 전체 에이전트 모델
language: ko # 보고서 언어
unit_limits: { max_files: 5, max_lines: 200 }
size_thresholds: { function_lines: 50, file_lines: 300 }
loop_limits:
critic_planner: 3 # 계획 리뷰 반복
step4b_critical: 2 # 전문가 사전 리뷰 재시도
step7_8: 2 # 검증 루프
step16: 3 # MEDIUM 이슈 해결
expert_panel:
mode: agent-team
discussion_rounds: 2
require_consensus: true전문가 리뷰 기준은 .claude/workflow/prompts/*.md에서 수정 가능 (22개 전문가 프롬프트).
회고 피드백은 .claude/memory/retrospective.md에 저장되어 다음 실행 시 자동 참조됩니다.
Anti-Rationalization & Red Flags
워크플로를 올바르게 따르도록 구조적으로 강제하는 두 가지 메커니즘:
Anti-Rationalization Tables — Phase A/B 각 단계에서 흔히 발생하는 합리화와 현실을 대조합니다.
| 합리화 | 현실 |
|---|---|
| "스펙이 명확하니까 Step 0은 건너뛰자" | Scope Challenge가 SMALL/STANDARD/LARGE를 결정한다. 건너뛰면 불필요한 파이프라인이나 검증 누락이 발생한다 |
| "구현이 간단하니까 TDD 없이 먼저 코드 작성" | 테스트 없는 코드는 Step 7 Expert Review에서 즉시 CRITICAL 이슈가 된다 |
| "이미 비슷한 걸 만들었으니 기존 코드 재사용은 안 해도 됨" | Reuse Review(Step 10)에서 중복 구현이 발견되면 재작업이 필요하다 |
Red Flags — 이 징후가 보이면 워크플로가 올바르게 실행되고 있지 않다:
workflow-state.json갱신 없이 3개 이상의 Step 진행- Plan에 없는 파일을 조용히 수정
- "나중에 테스트 작성하겠다"고 기록
- Step 6 Purpose Alignment를 "명백히 통과"로 건너뜀
- 전문가 리뷰에서 CRITICAL을 보고도 다음 Step으로 진행
- 스펙과 기존 코드가 충돌하는데 Confusion Management 없이 임의 해석으로 진행
Confusion Management Protocol — 스펙·코드·요구사항 간 불일치 발견 시 추측으로 진행하지 않고 명시적으로 혼동 지점을 명시한 뒤 사용자 결정을 기다린다.
Post-Implementation Simplicity Check — 구현 완료 후 불필요한 복잡성(추상화 과잉, 미사용 설계 여유, 코드 중복)을 탐지하여 제거한다.
안전 규칙
다음 작업은 어떠한 경우에도 절대 금지됩니다:
git push --force— 어떤 상황에서도 사용 불가main/master에 직접 병합 — PR만 허용rm -rf— 파괴적 삭제 금지- 실제 DB 접근 —
mysql,psql,redis-cli,mongosh - 실제 API 호출 — 외부 엔드포인트로의
curl,wget - 실제 서버 접근 —
ssh,scp,sftp - 시크릿 커밋 —
.env, 자격 증명, API 키 - 실제 외부 시스템을 사용한 테스트 — mock/stub만 허용
- simon/grind에서 직접
gh pr create실행 — simon-code-review 스킬을 통해서만 PR 생성
- Claude Code v2.0+
- Git
MIT