simon-bot

Claude Code를 위한 19단계 심층 구현 엔진

계획부터 PR까지, 22명의 전문가가 팀 토론으로 검증하는 자율 코딩 워크플로우

왜 simon-bot인가?

코드 품질을 타협하지 않습니다 — 19단계 파이프라인이 범위 검증부터 프로덕션 준비까지 모든 단계를 강제합니다
혼자 리뷰하지 않습니다 — 5개 도메인팀, 22명의 전문가가 팀 내 토론과 합의로 우려사항을 도출합니다
실패해도 포기하지 않습니다 — grind 모드는 자동 진단, 전략 전환, 체크포인트 롤백으로 끝까지 해결합니다
안전하게 격리됩니다 — 모든 작업은 독립 worktree에서 실행되고, TDD가 필수이며, 파괴적 명령은 차단됩니다
진행 상태를 잃지 않습니다 — State-Driven Execution으로 매 턴마다 workflow-state.json에서 정확한 Step 위치를 복원합니다

빠른 시작

git clone https://github.com/SW-in-beta/simon-bot
cd simon-bot
./install.sh

Claude Code에서 바로 사용하세요:

/simon-bot implement user authentication with JWT

동작 방식

graph LR
    A["Step 0-4B<br>계획 & 전문가 사전 리뷰"] --> B["Step 5<br>TDD 구현"]
    B --> C["Step 6-17<br>검증 & 리팩토링"]
    C --> D["Step 18-19<br>보고서 & PR"]
    style A fill:#e8f4f8,stroke:#2196f3
    style B fill:#e8f5e9,stroke:#4caf50
    style C fill:#fff3e0,stroke:#ff9800
    style D fill:#f3e5f5,stroke:#9c27b0

Phase A — 기존 코드 분석, 인터뷰, 계획 수립, 전문가 팀 사전 리뷰 (대화형)
Phase B-E — TDD 구현, 5개 팀 검증, 리팩토링, 회귀 테스트 (자율 실행)
마무리 — 인터랙티브 가이드 리뷰, 성공 기준 체크리스트 검증, PR 생성

에이전트 전략

신뢰도(Reliability)가 최우선 — 토큰 사용량이나 비용보다 결과의 정확성이 중요합니다.

패턴	언제 사용	핵심 원리
Agent Team (공유 컨텍스트)	서로 다른 관점의 에이전트가 토론으로 합의를 도출할 때	Six Thinking Hats — 각 에이전트가 고유 관점에서 논쟁하여 더 나은 결론 도출
SubAgent (독립 컨텍스트)	독립적인 분석이 수렴하여 신뢰도를 높일 때	Monte Carlo — 독립 시행의 수렴이 개별 분석보다 높은 신뢰도 보장

판단 기준: "에이전트들이 서로의 출력을 보면 더 나은 결과가 나오는가?"

YES → Agent Team (토론의 가치 > 독립성 손실) — 계획 수립, 설계 토론에 적합
NO → SubAgent (독립성의 가치 > 토론 부재) — 검증, 감사, 병렬 실행에 적합

검증/감사 단계에서 Agent Team의 의견 교환은 확증 편향(confirmation bias)의 경로가 됩니다. 검증이 목적인 단계에서는 SubAgent로 독립성을 구조적으로 보장합니다.

에이전트 프롬프트 구조: subagent/Agent Team 멤버에게 역할을 전달할 때 XML 태그(<role>, <context>, <instructions>)로 구조화합니다. compaction 시 역할/맥락/지시가 섞여 손실되는 것을 방지하며, 핵심 지시는 <instructions> 시작 부분에 배치합니다.

스킬

스킬	설명
`/simon-bot`	19단계 심층 워크플로우 — 계획, 구현, 검증을 최고 수준의 엄밀함으로 수행
`/simon-bot-grind`	열일모드 — 재시도 한계 10, 자동 진단/복구/전략 전환
`/simon-bot-pm`	프로젝트 매니저 — PRD 기반 전체 앱 기획, simon-bot 인스턴스에 작업 분배
`/simon-bot-review`	PR 기반 코드 리뷰 — Draft PR 생성, 인라인 리뷰 코멘트, CI Watch, 피드백 루프
`/simon-bot-sessions`	세션 관리 — worktree 기반 작업 세션 조회, 이어서 작업, 삭제
`/simon-bot-report`	사전 분석 보고서 — 전문가 팀 토론을 통한 RFC, 현황 분석, 커스텀 포맷
`/simon-bot-auto-boost`	자동 웹 검색 기반 스킬 개선 — 최신 AI 코딩 에이전트 best practices를 검색하여 스킬 자동 개선
`/simon-bot-boost`	외부 리소스 분석 — 링크를 읽고 스킬 개선을 제안
`/simon-bot-boost-capture`	작업 중 스킬 개선점 백그라운드 캡처 — 작업 흐름을 멈추지 않고 인사이트 기록
`/simon-bot-boost-review`	축적된 개선 인사이트 리뷰 & 적용 — 캡처된 개선안을 검토하고 스킬에 반영
`/simon-bot-ci-fix`	CI 실패 자동 수정 — 로그 분석, 에러 분류, 코드 수정, 푸시를 최대 5 사이클 반복
`/simon-company`	풀스택 소프트웨어 회사 — 다중 전문 팀 협업으로 기획부터 배포·운영까지 완성
`/simon-presenter`	라이브 데모 프레젠터 — Playwright로 앱을 실제 구동하며 인터랙티브 시연

어떤 스킬을 쓸까?

상황	스킬
기능 구현 또는 버그 수정	`/simon-bot`
실패하면 안 되는 복잡한 코드베이스	`/simon-bot-grind`
전체 앱 빌드 또는 멀티 피처 프로젝트	`/simon-bot-pm`
대규모 풀스택 서비스 (다중 팀 협업)	`/simon-company`
작업 완료 후 PR + 코드 리뷰	`/simon-bot-review`
이전 작업 세션 이어서 하기	`/simon-bot-sessions`
RFC, 아키텍처 분석, 보고서 (코드 변경 없음)	`/simon-bot-report`
유용한 아티클/레포 발견 — 스킬 개선	`/simon-bot-boost`
최신 트렌드 자동 검색 — 스킬 자동 개선	`/simon-bot-auto-boost`
작업 중 스킬 개선점 메모 (작업 흐름 유지)	`/simon-bot-boost-capture`
축적된 개선안 일괄 검토 & 적용	`/simon-bot-boost-review`
CI 실패 자동 수정 (PR checks 실패)	`/simon-bot-ci-fix`
완성된 앱 라이브 데모 시연	`/simon-presenter`

전문가 팀 구조 (5개 도메인팀, 22명)

전문가들은 개별 리뷰가 아닌 팀 내 토론을 통해 합의 기반으로 우려사항을 도출합니다.

팀	멤버	활성화	토론 초점
Safety	appsec, auth, infrasec, stability	항상 (appsec+stability)	보안 경계, 인증 우회, 장애 복구
Code Design	convention, idiom, design-pattern, testability	항상 (convention+idiom)	레포 컨벤션, 언어 관용구, 설계 패턴, 테스트 가능성
Data	rdbms, cache, nosql	auto-detect (min 2)	데이터 일관성, 캐시 무효화, 스토리지 정합성
Integration	sync-api, async, external-integration, messaging	auto-detect (min 2)	동기/비동기 경계, 에러 전파, 장애 격리
Ops	infra, observability, performance, concurrency	auto-detect (min 2)	운영 안정성, 관측 가능성, 성능

simon-bot-grind 상세

simon-bot을 최대 집요함으로 확장합니다:

모든 재시도 한계 = 10 — 쉽게 포기하지 않습니다
에스컬레이션 래더 — 단순 수정 → 근본 원인 분석 → 전략 전환 → 최후의 수단
자동 진단 — 실패 추적, 패턴 감지, 전략 전환
체크포인트 정책 — 티어 경계(Attempt 3→4, 6→7) 자동 체크포인트, 진전 시 best 태그, 전략 전환 시 best로 롤백
진행 감지 — 2회 연속 정체 시 즉시 전략 전환
Hypothesis Reset Protocol — 동일 에러 3회 반복 감지 시 현재 가설의 근본 가정을 의심하고 대안 가설 2개 이상 도출. "열심히 했지만 같은 방법을 10번 시도한 것" 방지
Cross-Step Compounding Failure 감지 — 동일 파일이 3개 이상 Step에서 반복 실패 시 기초 설계 결정 재검토
Architecture Sanity Check — Step 8 이후 전체 diff의 아키텍처 일관성 1-pass 검증 (STANDARD+ 경로)
총 재시도 예산 — 전체 50회, 70% 도달 시 경고
레퍼런스 지연 로딩 — Startup/Phase 진입/에러 발생 시점에 필요한 파일만 로딩
신뢰도 점수 — 모든 에이전트 출력에 신뢰도 + 영향도 태깅

simon-bot-pm 상세

7단계 프로젝트 매니저 파이프라인:

단계	이름	역할
0	Project Setup	프로젝트 유형 감지, 실행 모드 선택
1	Spec-Driven Design	인터뷰 → Spec(WHAT) → Architecture(HOW) → PRD
2	Task Breakdown	PRD → 기능 분해 → 의존성 그래프 → 실행 계획
3	Environment Setup	스캐폴딩, 의존성, 설정
4	Feature Execution	simon-bot/grind 인스턴스에 기능 분배 (가능한 경우 병렬)
5	Full Verification	통합 테스트, 아키텍처 리뷰, 보안 리뷰
6	Delivery	최종 보고서, 가이드 리뷰, PR 생성

복잡도에 따라 simon-bot 또는 simon-bot-grind를 자동 할당합니다. Phase 4 진입 시 PM은 Phase 1-3의 과정을 컨텍스트에서 제거하고 결과물만 로딩하여 컨텍스트 효율을 최적화합니다.

simon-bot-review 상세

작업 완료 후 PR 생성과 코드 리뷰를 수행합니다:

Draft PR 생성 — 변경사항 분석 기반 PR 자동 생성 + Review Guide 섹션 포함
Blind-First 2-Pass 리뷰 — review-sequence.md에 anchoring되지 않도록 diff만으로 먼저 분석 후 대조. 독립 severity 판정 후 구현자 판정과 불일치 시 [SEVERITY-DISPUTED] 태깅
기존 패턴 스캔 — diff에 도입된 새 패턴에 대해 코드베이스 내 기존 대안을 능동적으로 탐색
공식 문서 검증 — 사용된 API/패턴을 공식 문서(context7 MCP, WebSearch)로 fact-check하여 deprecated API, anti-pattern 사전 식별
영향 분석 Pass — 변경되지 않았지만 영향받을 수 있는 코드를 1-depth 탐색하여 인라인 코멘트 작성
Architecture Impact — Review Summary에 의존성 방향, 모듈 경계, 확장성, 데이터 흐름 관점의 아키텍처 영향 분석 포함 (STANDARD+ 경로)
대규모 PR 처리 — 100+ 파일 PR은 Core/Support/Generated로 분류, 핵심 파일에 80% 집중
CI Watch — CI 모니터링 + 실패 자동 수정을 simon-bot-ci-fix에 위임 (에러 분류→진단→수정→푸시, 최대 5 cycles)
Comment Auto-Watch — 1분 간격 PR 댓글 자동 감지, 새 피드백 즉시 반영
전문가 검증 피드백 루프 — 사용자 코멘트에 대해 도메인 전문가 Agent를 호출하여 검증 후 처리 (AGREE/PARTIAL/COUNTER verdict, Self-Agreement Bias 견제 포함)
중단 복구 프로토콜 — push 실패, API 오류 등으로 중단 시 잔여 워크플로를 자동 재개. 인라인 리뷰 누락 방지
피드백 루프 — 코드 수정 → 커밋 → 인라인 리뷰 재작성 → CI 재확인

STANDALONE 모드에서는 3개 Agent Team(architect, writer, impact-analyzer)이 병렬 분석하여 review-sequence를 자체 생성합니다.

simon-company 상세

대규모 풀스택 서비스를 다중 전문 팀(PM, Design, Frontend, Backend, QA, DBA, DevOps, ML)이 협업하여 완성합니다:

의뢰 모드 — 불명확한 아이디어를 구조화된 인터뷰로 구체화
Scope Guard — 소규모 프로젝트는 simon-bot-pm으로 자동 리다이렉트
전체 라이프사이클 — 기획 → 디자인 → 개발 → QA → 배포 → 운영
명시적 호출 전용 (/simon-company)

simon-presenter 상세

완성된 앱을 Playwright headed 브라우저로 실제 구동하며 인터랙티브하게 시연합니다:

유저스토리 기반 시나리오로 앱의 핵심 기능 시연
실제 브라우저 조작으로 동작 검증
이해관계자에게 보여주기 위한 프레젠테이션 모드

기타 스킬 상세 (report / boost 패밀리 / sessions)

simon-bot-report — 코드 변경 없이 구현 전 분석 문서(RFC, 현황 분석, 커스텀 포맷)를 생성합니다. simon-bot과 동일한 5개 도메인 전문가 팀 토론 구조를 사용하며, 리뷰 후 simon-bot / simon-bot-pm으로 원활하게 핸드오프할 수 있습니다.

simon-bot-auto-boost — Claude Code 공식 문서, Hacker News, Medium, YouTube 등에서 최신 AI 코딩 에이전트 best practices를 자동 검색하고, 6인 전문가 패널 분석 → 사용자 승인 → 적용 → 스킬 가이드라인 검증 → 스모크 테스트까지 수행합니다. 마지막 검색 시점을 기록하여 이후 콘텐츠만 처리합니다.

simon-bot-boost — 외부 리소스(블로그, GitHub, 논문)를 읽고 6인 전문가 패널이 스킬 개선을 제안합니다. 모든 제안은 적용 전 명시적 승인이 필요하며 .claude/boost/applied-log.md에 기록됩니다.

simon-bot-boost-capture — 작업 중 발견한 스킬 개선점을 백그라운드로 분석·기록합니다. 작업 흐름을 멈추지 않고 인사이트를 캡처하여 나중에 일괄 처리할 수 있습니다.

simon-bot-boost-review — simon-bot-boost-capture로 축적된 개선 인사이트를 검토하고 실제 스킬에 반영합니다. 캡처된 개선안을 모아서 한번에 처리할 때 사용합니다.

simon-bot-ci-fix — PR의 CI 체크를 모니터링하고 실패 시 자동으로 수정합니다. 에러 유형별 전문 복구 전략으로 최대 5회 사이클(로그 분석→에러 분류→코드 수정→푸시→재확인)을 반복합니다. simon-bot-review의 CI Watch 단계에서 자동 호출되거나, 독립 실행도 가능합니다.

simon-bot-sync — simon-* 스킬 파일의 변경사항을 ~/simon-bot 오픈소스 레포에 동기화합니다. PostToolUse 훅이 ~/.claude/skills/simon-* 파일 변경을 감지하면 Stop 훅이 자동 트리거하며, 10분 쿨다운으로 연속 수정 시 불필요한 반복을 방지합니다. 수동 호출(/simon-bot-sync)도 가능합니다.

simon-bot-sessions — 여러 Claude Code 세션에 걸친 worktree 기반 작업을 관리합니다: list | search <keyword> | info <branch> | resume <branch> | delete <branch> | pr <branch>. search 명령으로 키워드 기반 세션 검색(브랜치명, 커밋 메시지, CONTEXT.md)이 가능합니다. resume 시 상태 기반 Recommended Action을 제시합니다.

설정 (config.yaml)

model_policy: opus                    # 전체 에이전트 모델
language: ko                          # 보고서 언어
unit_limits: { max_files: 5, max_lines: 200 }
size_thresholds: { function_lines: 50, file_lines: 300 }
loop_limits:
  critic_planner: 3                   # 계획 리뷰 반복
  step4b_critical: 2                  # 전문가 사전 리뷰 재시도
  step7_8: 2                          # 검증 루프
  step16: 3                           # MEDIUM 이슈 해결
expert_panel:
  mode: agent-team
  discussion_rounds: 2
  require_consensus: true

전문가 리뷰 기준은 .claude/workflow/prompts/*.md에서 수정 가능 (22개 전문가 프롬프트). 회고 피드백은 .claude/memory/retrospective.md에 저장되어 다음 실행 시 자동 참조됩니다.

안전 규칙

다음 작업은 어떠한 경우에도 절대 금지됩니다:

git push --force — 어떤 상황에서도 사용 불가
main/master에 직접 병합 — PR만 허용
rm -rf — 파괴적 삭제 금지
실제 DB 접근 — mysql, psql, redis-cli, mongosh
실제 API 호출 — 외부 엔드포인트로의 curl, wget
실제 서버 접근 — ssh, scp, sftp
시크릿 커밋 — .env, 자격 증명, API 키
실제 외부 시스템을 사용한 테스트 — mock/stub만 허용
simon-bot/grind에서 직접 gh pr create 실행 — simon-bot-review 스킬을 통해서만 PR 생성

요구 사항

Claude Code v2.0+
Git

라이선스

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 83 Commits
boost		boost
hooks		hooks
skills		skills
workflow		workflow
.gitignore		.gitignore
LICENSE		LICENSE
README.en.md		README.en.md
README.md		README.md
install.sh		install.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

simon-bot

왜 simon-bot인가?

빠른 시작

동작 방식

에이전트 전략

스킬

어떤 스킬을 쓸까?

요구 사항

라이선스

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

simon-bot

왜 simon-bot인가?

빠른 시작

동작 방식

에이전트 전략

스킬

어떤 스킬을 쓸까?

요구 사항

라이선스

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages