Skip to content
leeyc blog Search
← Back to blog

gstack - Claude Code를 가상 엔지니어링 팀으로 만드는 AI 툴킷

gstack이란?

gstack은 Y Combinator CEO Garry Tan이 만든 오픈소스 툴킷이다. Claude Code를 단순한 코파일럿이 아닌, 가상 엔지니어링 팀으로 변환한다.

핵심 아이디어는 간단하다. AI에게 역할을 부여하고, 스프린트 프로세스를 따르게 한다.

Think → Plan → Build → Review → Test → Ship → Reflect

28개의 슬래시 커맨드 스킬이 이 스프린트 단계별로 조직되어 있고, 각 스킬은 이전 단계의 출력을 읽어 피드백 루프를 형성한다.


왜 주목할 만한가?

Garry Tan은 gstack으로 60일간 60만 줄 이상의 프로덕션 코드(35%가 테스트)를 작성했다. YC를 풀타임으로 운영하면서도 하루 1~2만 줄을 찍어낸 셈이다.

지표수치
60일간 총 코드량600,000+ 줄
일일 코드 생산량10,000~20,000 줄
1주일 기록140,751줄 추가, 362 커밋
2026년 총 기여1,237+ 커밋

핵심은 단순히 코드를 많이 생성하는 게 아니라, 리뷰-테스트-배포까지 포함한 전체 프로세스를 자동화했다는 점이다.


아키텍처: 스프린트 기반 스킬 시스템

gstack의 설계 철학은 **프로세스 우선(Process-first)**이다. 랜덤한 도구 모음이 아니라, 실제 소프트웨어 개발 스프린트를 그대로 따른다.

┌──────────────────────────────────────────────────────────────┐
│                    gstack Sprint Process                      │
│                                                              │
│  ┌─────────┐   ┌──────┐   ┌───────┐   ┌────────┐            │
│  │  Think   │ → │ Plan │ → │ Build │ → │ Review │            │
│  │          │   │      │   │       │   │        │            │
│  │ /office- │   │/plan-│   │Claude │   │/review │            │
│  │  hours   │   │ ceo- │   │ Code  │   │        │            │
│  │          │   │review│   │       │   │        │            │
│  └─────────┘   └──────┘   └───────┘   └────────┘            │
│       ↓             ↓          ↓            ↓                │
│  ┌─────────┐   ┌──────┐   ┌───────┐   ┌────────┐            │
│  │  Test   │ → │ Ship │ → │Deploy │ → │Reflect │            │
│  │         │   │      │   │       │   │        │            │
│  │  /qa    │   │/ship │   │/land- │   │ /retro │            │
│  │  /cso   │   │      │   │and-   │   │        │            │
│  │         │   │      │   │deploy │   │        │            │
│  └─────────┘   └──────┘   └───────┘   └────────┘            │
│                                                              │
│  각 스킬은 이전 단계의 출력을 입력으로 사용 (피드백 루프)       │
└──────────────────────────────────────────────────────────────┘

20개 핵심 스킬 상세

1. 기획 & 디자인 (Planning & Design)

스킬설명
/office-hoursYC 스타일 제품 리프레이밍. 6가지 강제 질문으로 아이디어를 재구성
/plan-ceo-reviewCEO 관점 스코프 리뷰. 확장/선택적 확장/유지/축소 4가지 모드
/plan-eng-review아키텍처 확정. 다이어그램과 테스트 매트릭스 포함
/plan-design-review디자인 감사. 0-10점 평가와 개선 가이드
/design-consultation디자인 시스템을 처음부터 생성

/office-hours가 특히 흥미롭다. 단순히 “이거 만들어줘”가 아니라, YC 오피스 아워처럼 제품의 본질을 재정의하는 과정을 거친다.

2. 개발 & 리뷰 (Development & Review)

스킬설명
/reviewStaff Engineer 수준의 코드 리뷰. 명백한 문제는 자동 수정
/investigate가설 기반 디버깅. 3번 실패하면 자동 중단
/design-review디자인 감사 + 구현. atomic commit 단위로 작업

/investigate3회 실패 자동 중단 메커니즘이 눈에 띈다. AI가 무한 루프에 빠지는 것을 방지하는 실용적인 설계다.

3. 테스트 & 품질 (Testing & Quality)

스킬설명
/qa브라우저 테스트 + 버그 수정 + 회귀 테스트 자동 생성
/qa-only코드 변경 없이 버그 리포트만 생성
/csoOWASP Top 10 + STRIDE 위협 모델링 기반 보안 감사

/qa는 실제 Chromium 브라우저를 사용하는 것이 핵심이다. mocking이 아닌 실제 브라우저 자동화로 테스트한다.

4. 릴리스 & 운영 (Release & Operations)

스킬설명
/ship테스트 스위트 동기화, 커버리지 감사, PR 생성
/land-and-deployPR 머지부터 프로덕션 검증까지 한 명령으로
/canary배포 후 콘솔 에러, 성능 회귀 모니터링
/benchmarkCore Web Vitals, 페이지 로드 타임 비교

5. 유틸리티 (Utilities)

스킬설명
/browseChromium 브라우저 자동화 (명령당 ~100ms)
/document-release문서 자동 업데이트
/retro주간 회고. 팀원별 분석 포함
/autoplan리뷰 포함 전체 계획 한 번에 생성
/codexOpenAI Codex CLI를 통한 크로스 모델 코드 리뷰

안전장치 (Power Tools)

gstack은 AI가 위험한 작업을 수행하는 것을 방지하는 8가지 안전 스킬을 제공한다.

/careful   → 파괴적 명령 실행 전 경고 + 확인 요구
/freeze    → 디버깅 중 특정 디렉토리만 편집 허용
/guard     → /careful + /freeze 결합 (프로덕션 작업용)
/unfreeze  → 편집 제한 해제

이건 실제로 매우 실용적이다. Claude Code가 실수로 잘못된 파일을 수정하거나, 위험한 git 명령을 실행하는 것을 구조적으로 방지한다.


실제 워크플로우 예시

“일일 캘린더 브리핑 앱”을 만드는 시나리오를 보자.

1. /office-hours     → "개인 비서 AI"로 제품 리프레이밍
2. /plan-ceo-review  → 스코프 도전, 핵심 기능 확정
3. /plan-eng-review  → 아키텍처 확정 (ASCII 다이어그램 + 테스트 매트릭스)
4. Claude Code 구현   → 11개 파일, 2,400줄 (~8분)
5. /review           → 2개 이슈 발견, 자동 수정
6. /qa               → 스테이징 테스트, 버그 1개 발견 및 수정
7. /ship             → PR 생성 (테스트 커버리지 검증 포함)

총 8개 명령으로 대화부터 배포 가능한 PR까지 완성된다.


병렬 실행: Conductor 연동

gstack은 Conductor와 연동하여 여러 Claude Code 세션을 동시에 실행할 수 있다. 각 에이전트가 격리된 워크스페이스에서 자신의 역할을 수행하고, 언제 멈춰야 할지 알고 있다.

스프린트 구조 자체가 병렬성을 가능하게 한다. 개별 도구가 아닌 프로세스 단위의 병렬화다.


설치 (30초)

요구 사항

글로벌 설치

git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack
./setup

프로젝트별 설치

cp -Rf ~/.claude/skills/gstack .claude/skills/gstack
rm -rf .claude/skills/gstack/.git
cd .claude/skills/gstack
./setup

Codex / Gemini CLI / Cursor 지원

git clone https://github.com/garrytan/gstack.git .agents/skills/gstack
cd .agents/skills/gstack
./setup --host codex  # 또는 'gemini', 'auto'

모든 파일은 .claude/ 또는 .agents/skills/ 안에 위치한다. 시스템 경로를 수정하거나 백그라운드 서비스를 실행하지 않는다.


크로스 플랫폼 호환성

gstack은 SKILL.md 표준을 사용하여 여러 AI 코딩 도구에서 작동한다.

플랫폼지원
Claude CodeO (기본)
OpenAI Codex CLIO
CursorO
Gemini CLIO

프라이버시 & 텔레메트리

항목내용
기본 설정꺼짐 (opt-in)
수집 데이터 (활성화 시)스킬 이름, 소요 시간, 성공/실패, 버전, OS
절대 수집하지 않는 것코드, 파일 경로, 레포 이름, 브랜치, 프롬프트
비활성화gstack-config set telemetry off

기존 도구들과의 차이점

비교 항목일반 AI 코파일럿gstack
접근 방식빈 캔버스에서 시작스프린트 프로세스 기반
코드 리뷰수동 요청/review로 Staff Engineer 수준 자동 리뷰
테스트별도 설정 필요/qa로 실제 브라우저 테스트 자동화
보안개발자 책임/cso로 OWASP/STRIDE 자동 감사
배포수동/land-and-deploy로 원커맨드 배포
안전장치없음/careful, /freeze, /guard
피드백 루프없음각 스킬이 이전 단계 출력을 읽음

핵심 설계 원칙

  1. 프로세스 우선: 랜덤한 도구 모음이 아닌 실제 스프린트를 따른다
  2. 피드백 루프: 각 스킬이 이전 단계의 출력을 입력으로 사용한다
  3. 안전 우선: 파괴적 명령 경고, 편집 잠금, 3회 실패 시 자동 중단
  4. Zero False Positive: 보안 감사에서 거짓 양성을 최소화한다
  5. 자체 업데이트: /gstack-upgrade로 항상 최신 버전 유지

마무리

gstack의 핵심 통찰은 AI에게 빈 캔버스를 주는 것이 아니라, 역할과 프로세스를 부여하는 것이다. 각 슬래시 커맨드가 특정 역할(CEO, Staff Engineer, QA, Security Officer)을 수행하고, 스프린트 순서를 따르면서 피드백 루프를 형성한다.

Karpathy가 2026년 3월 No Priors 팟캐스트에서 말한 것처럼, “12월 이후로 코드를 한 줄도 직접 타이핑하지 않았다”는 시대가 오고 있다. gstack은 그 시대를 위한 구조화된 프레임워크다.


← Previous Repomix - 코드베이스를 AI에게 먹이는 가장 빠른 방법 Next → QMD - 로컬에서 돌아가는 마크다운 검색 엔진