본문으로 건너뛰기
50% 할인 모든 플랜, 기간 한정. 시작 가격 $2.48/mo
8 min left
AI 및 머신러닝

바이브 코더들이 엔지니어링이 남기고 떠난 규칙 계층을 다시 세우고 있다

S By Steve 8 min read
A CLAUDE.md file open in a dark-mode code editor showing AI coding quality rules alongside a passing test suite, illustrating how vibe coders encode engineering discipline as agent instructions

178,000명이 넘는 GitHub 사용자가 마크다운 파일 하나에 별을 달았다. 그 파일은 AI가 어떻게 행동해야 하는지 알려줄 뿐이다.

네 가지 규칙: 코딩 전에 생각하라. 단순함이 먼저다. 외과적인 변경. 목표 지향적 실행. 그게 전부다. 라이브러리도, 프레임워크도, 설치 프로그램도 없다. Forrest Chang은 LLM 코딩 실패 양상에 관한 Andrej Karpathy의 관찰을 하나의 CLAUDE.md 파일로 묶었고, 그 후 몇 달 동안 개발자 커뮤니티는 그것을 178,000개가 넘는 GitHub 스타로 밀어 올렸다.

그곳에서 일어난 일을 가늘게 뜬 눈으로 들여다보면, 모든 엔지니어링 조직이 충분한 고통을 겪은 끝에 결국 필요하다고 깨달은 것과 무척 닮아 보인다. 코드가 어떻게 작성되는지에 관한 공유된 제약의 집합. 규칙 계층. 한때 코드 리뷰 체크리스트나 스타일 가이드, 또는 시니어 엔지니어의 머릿속 기억에 살던 그런 것 말이다. 바이브 코딩 커뮤니티는 그 동일한 규율의 훨씬 가벼운 버전을 찾아냈다. 규칙을 마크다운으로 적어두고, 에이전트가 코드를 작성하기 전에 그것을 읽게 하는 것이다.

이것은 일회성이 아니다. 하나의 패턴이다.

요약

  • 에이전트 지침 생태계(CLAUDE.md, AGENTS.md, 공유 스킬 라이브러리, 접근성 에이전트)는 AI 보조 코딩을 위한 분산된 품질 시행 계층이 되어가고 있다.
  • 그것이 대응하는 품질 격차는 실재한다. Snyk는 ClawHub와 skills.sh에서 3,984개의 스킬을 스캔하여, 1,467개, 즉 36.82%가 적어도 하나의 보안 결함을 가지고 있고, 534개, 즉 13.4%가 적어도 하나의 치명적 수준 문제를 가지고 있음을 발견했다.
  • 커뮤니티의 대응은 이 접근법을 버리는 것이 아니라 더 많은 규칙을 만드는 것이었고, Vercel에서 OWASP, Linux Foundation에 이르는 기관들이 이제 여기에 관여하고 있다.

품질 격차는 실재하고, 커뮤니티는 그것을 알고 있다

Bar chart contrasting the share of community AI agent skills with security flaws (36.82%) and critical-level flaws (13.4%) from Snyk's ToxicSkills scan of 3,984 skills

커뮤니티 스킬 파일의 13.4%가 치명적 보안 결함을 담고 있다. 이는 Snyk의 ToxicSkills 보고서에서 나온 수치로, ClawHub와 skills.sh에서 3,984개의 스킬을 스캔한 뒤 2026년 2월에 발표되었다. 36.82%가 적어도 하나의 보안 취약점을 가지고 있었다. 76개는 노골적으로 악성이었으며, 그중 91%가 프롬프트 인젝션을 전달 메커니즘으로 사용했다.

더 넓은 AI 코드 품질 이야기도 비슷하다. CodeRabbit의 코드 리뷰 데이터 분석에 따르면, AI 보조 코드는 풀 리퀘스트당 평균 10.83개의 문제를 보이는 반면 사람이 작성한 코드는 6.45개로, 대략 1.7배 더 많은 문제를 보인다. GitClear의 연례 코드 연구는 코드 복제에서 그들이 "4배 증가"라고 부르는 현상을 보고했다. 변경된 라인 중 비율이 2021년 8.3%에서 2024년 12.3%로 상승한 것이다.

이것들은 벤더 수치이므로 그 정밀도는 적절한 회의로 받아들여야 한다. 그래도 방향성 면에서는 유용하다. AI 보조 코딩이 개발자들이 그 주변에 새로운 가드레일을 세울 만큼 충분한 품질 압박을 만들어내고 있다는 것이다.

중요한 것은 커뮤니티가 이 정보로 무엇을 했는가다. 대응은 "스킬 파일은 위험하니 사용을 멈춰라"가 아니었다. 그것은 OWASP가 Agentic Skills Top 10 (AST10)을 출범시킨 것이었다. 웹 애플리케이션 보안 Top 10의 스킬 생태계 버전이다. 더 많은 규칙. 더 많은 구조. 비공식 생태계를 위한 공식 보안 프레임워크.

이는 무거운 프로세스를 종종 피하려는 커뮤니티에서 나온 것이라 해도 전형적인 엔지니어링 대응이다.

등장한 생태계

Layered diagram of the AI coding rules ecosystem: a behavioral layer (CLAUDE.md), a community aggregation layer (Awesome Skills), a framework layer (Vercel agent-skills), and a standards layer (AGENTS.md)

2026년 상반기에 걸쳐, 이것은 한 줌의 고립된 마크다운 파일이라기보다 계층화된 생태계처럼 보이기 시작했다.

행동 계층부터 시작하자. Karpathy에서 영감을 받은 CLAUDE.md 는 LLM 코딩 실패 양상에 관한 Andrej Karpathy의 관찰을 담은 Forrest Chang의 버전을 하나의 지침 파일로 묶었고, 이제 178,000개가 넘는 GitHub 스타를 받으며 GitHub 역사상 가장 별이 많은 저장소 중 하나에 올라 있다. 네 가지 단순한 규칙을 중심으로 만들어진 파일치고는 말이다. 그 규칙들이 무엇인지는 그것들이 무엇을 나타내는지보다 덜 흥미롭다. 시니어 엔지니어가 코드 리뷰 중에 적용할 판단을 인코딩하려는 시도 말이다.

그 위에는 커뮤니티 집계 계층이 자리한다. Antigravity Awesome Skills는 1,595개 이상의 에이전트 스킬을 넘어섰고, Claude Code, Cursor, Codex CLI, Gemini CLI, Antigravity, 그 밖의 AI 코딩 어시스턴트를 위한 재사용 가능한 플레이북을 모은다. 이는 이 분야를 위한 빠르게 움직이는 공유 라이브러리처럼 기능한다. 표준 위원회가 PDF가 아니라 GitHub를 통해 움직였다면 만들어냈을 법한 그런 것이다.

그다음 프레임워크가 등장했다. Vercel은 vercel-labs/agent-skills 를 공식 조직 저장소로 만들었고, 이제 28,000개의 스타를 받고 있다. React Best Practices 스킬 하나만 해도 여덟 개의 성능 중심 범주에 걸쳐 40개 이상의 규칙을 담고 있는데, 여기에는 워터폴, 번들 크기, 서버 측 성능, 클라이언트 측 데이터 페칭, 리렌더 최적화, 렌더링 성능, JavaScript 마이크로 최적화가 포함된다. 당신의 배포 플랫폼을 소유한 회사가 AI 에이전트를 위한 공식 품질 규칙을 내놓으면, 그 생태계는 커뮤니티 실험에서 프로덕션 인프라로 졸업한 것이다.

그리고 맨 위에는 표준 계층이 있다. OpenAI는 AGENTS.md 명세를 MCP (Anthropic), Goose (Block)와 함께 Linux Foundation의 Agentic AI Foundation (AAIF)에 기증했다. 도구 간, 에이전트 간, 표준 트랙이다. 방향은 이식성을 향한다. AGENTS.md는 팀에게 프로젝트별 에이전트 지침을 위한 공유된 자리를 제공한다. 개별 도구가 그 지침을 로드하고 적용하는 방식에서는 여전히 차이가 날 수 있더라도 말이다.

이 조각들은 하나의 중앙 계획된 스택으로 등장한 것이 아니다. 수요가 실재했기에 수렴한 것이다.

아무도 이야기하지 않는 차원

An accessibility agent flagging a modal that traps screen readers and missing ARIA roles in AI-generated UI code, with WCAG 2.2 AA checks listed alongside

보안과 코드 품질 데이터는 다뤄진다. 접근성 차원은 거의 다뤄지지 않는다.

Community-Access/accessibility-agents 는 2026년 2월 21일에 여섯 개의 에이전트로 시작했다. 2026년 6월 기준: 여덟 개 팀에 걸친 79개의 전문 에이전트, 18개의 재사용 가능한 접근성 스킬, WCAG 2.2 AA 목표, 그리고 다섯 개 플랫폼 지원이다. Claude Code, GitHub Copilot, Gemini CLI, Codex CLI, 그리고 MCP 호환 클라이언트에 제공할 수 있는 MCP Server다.

이 프로젝트가 무엇인지 쉽게 말하면 이렇다. 개발자 커뮤니티가 AI 코딩 도구는 기본적으로 접근 불가능한 코드를 생성한다고 (ARIA 규칙을 건너뛰고, 키보드 내비게이션을 무시하며, 스크린 리더를 가두는 모달을 만든다고) 판단하고, AI가 계속 잊어버리는 규칙을 시행하기 위해 79개의 전문 에이전트를 만든 것이다.

그것은 일어나기 놀라운 일이다. 프론트엔드 엔지니어들은 역사적으로 접근성에서 기대에 못 미쳐왔다. 마감 압박 속에서 가장 먼저 잘려나가는 것이 접근성이다. accessibility-agents 프로젝트는 바이브 코더들이 그렇지 않았다면 시니어 엔지니어에게 시행을 맡겨야 했을 규칙을 직접 쓰는 일이고, 그것을 다섯 개의 지원되는 통합에 걸쳐, 공개적으로, 무료로 하고 있다.

내가 읽기로는, 이 프로젝트는 자원봉사 접근성 활동치고 유난히 철저하다. 특히 접근성을 뒤늦은 QA 관심사에서 코드 생성 중에 실행되는 재사용 가능한 에이전트 지침으로 바꿔놓기 때문이다.

이것이 필연이었던 이유

"스킬 파일은 AI를 위한 README일 뿐"이라는 주장은 어느 한 파일만 본다면 타당하다. 하지만 OWASP가 생태계를 위한 보안 프레임워크를 출범시키고, Vercel이 공식 품질 라이브러리를 내놓으며, 자원봉사 접근성 프로젝트가 79개의 전문 에이전트로 자라나는 것을 보면 그 주장은 더 이상 성립하지 않는다.

실제로 벌어지는 일은 이렇다. 품질 시행은 프로세스를 없앤다고 사라지지 않는다. 그것은 다른 형태로 다시 나타난다. 품질의 부재가 빠르게 고통을 만들어내고, 그 고통에 가장 가까운 사람이 근원에서 그것을 고치기 때문이다.

전통적인 엔지니어링 규율(코드 리뷰, 스타일 가이드, QA 게이트, 아키텍처 거버넌스)은 개별 개발자가 시간 압박 속에서 건너뛰는 것을 잡아내기 위해 존재한다. 그것은 팀과 프로세스가 있을 때 작동한다. 바이브 코더들은 설계상 둘 다 없는 경우가 많다. 그래서 그들은 리뷰를 에이전트의 지침에 미리 인코딩했다.

CLAUDE.md는 미리 인코딩된 코드 리뷰다. Awesome Skills는 분산된 스타일 가이드다. AGENTS.md는 거버넌스 표준이다. 단어는 바뀌었다. 기능은 바뀌지 않았다.

흥미로운 점은 제약이 다시 나타났다는 것이 아니다. 그건 필연이었다. 흥미로운 점은 그것이 처음보다 더 빨리, 더 공개적으로, 그리고 성숙한 프로세스를 갖춘 일부 엔지니어링 조직을 무색하게 만드는 품질 수준으로 다시 나타났다는 것이다.

바이브 코딩 커뮤니티는 경영진의 압박에 못 이겨 마지못해 엔지니어링 규율을 재발명한 것이 아니다. 그들은 벽에 부딪혔고 그것을 고칠 도구가 마크다운 파일 하나 거리에 있었기에 그것을 만든 것이다.

자주 묻는 질문

CLAUDE.md 파일에는 무엇이 들어가나?

AI를 위한 행동 제약이다. 무엇을 피할지, 무엇을 우선할지, 아키텍처 규칙, 보안 위험 신호, 그리고 프로젝트별 관례다. 품질 중심의 활용은 워크플로 단축키를 넘어선다. "테스트를 통과시키려고 에러 처리를 절대 제거하지 마라" 같은 규칙이 "항상 TypeScript를 사용하라"와 나란히 놓인다. 실제로 검증된 예시는 Awesome Skills 커뮤니티 집계. Vercel의 agent-skills 는 또 하나의 훌륭한 참고 자료다.

AGENTS.md란 무엇이며 CLAUDE.md와 어떻게 다른가?

AGENTS.md는 프로젝트별 에이전트 지침을 위한 범용 표준으로, OpenAI가 출시하고 2025년 12월 Linux Foundation의 Agentic AI Foundation에 기여했다. CLAUDE.md는 Claude Code의 프로젝트 지침 파일이다. 둘은 목적이 겹치지만, 모든 도구에서 동일한 형식은 아니다. 실용적인 결론은, 팀이 점점 더 에이전트 지침을 한 번 작성해 Codex, Cursor, Copilot, Gemini CLI, Claude Code 같은 도구들에 걸쳐 적용할 수 있게 된다는 것이다.

스킬 파일은 안전하게 사용할 수 있나?

커뮤니티에서 가져온 스킬은 가져오기 전에 읽어봐야 한다. Snyk의 ToxicSkills 보고서 는 스캔한 커뮤니티 스킬의 36%가 적어도 하나의 보안 결함을 가지고 있고, 13.4%가 치명적 수준의 결함을 가지고 있으며, 프롬프트 인젝션이 주된 공격 메커니즘임을 발견했다. OWASP Agentic Skills Top 10 은 공격 표면을 이해하기 위한 참고 프레임워크다. 공식 저장소나 잘 알려진 오픈소스 프로젝트의 스킬 파일은 일반적으로 익명의 커뮤니티 기여물보다 공급망 위험이 낮지만, 그래도 가져오기 전에 검토해야 한다.

OWASP Agentic Skills Top 10 (AST10)이란 무엇인가?

OWASP의 2026년 스킬 생태계 보안 프레임워크로, OWASP 웹 애플리케이션 보안 Top 10과 유사하지만 AI 에이전트 지침 파일이 만들어내는 공격 표면을 구체적으로 다룬다. Claude Code, Cursor/Codex, VS Code를 포함한 플랫폼들에 걸쳐 가장 치명적인 열 가지 보안 위험을 다룬다. 이 프레임워크는 2026년 기준 활발히 개발 중이며, v1.0 릴리스는 2026년 4분기로 계획되어 있다.

개인 프로젝트를 만든다면 스킬 파일이 필요한가?

일관된 AI 동작을 원할 때만 필요하다. 제약이 없으면 AI 코딩 도구는 코드 품질이 아니라 작업 완료를 최적화하며, 이는 중복된 로직이나 누락된 에러 처리, 접근 불가능한 UI 컴포넌트를 만들어내기 전까지는 잘 작동한다. 부담은 낮다. 프로젝트당 파일 하나면 되고, AI가 계속 틀리는 것을 발견해가며 관리하면 된다. Karpathy에서 영감을 받은 규칙은 합리적인 출발점이다. 커뮤니티 스킬 라이브러리는 도메인 특화 규칙(보안, 접근성, 언어 관용구)을 처음부터 작성하지 않고도 끌어다 쓸 수 있게 해준다.

Share

블로그 더 보기

계속 읽기.

배포할 준비가 되셨나요? 월 $2.48부터.

2008년부터 독립 클라우드. AMD EPYC, NVMe, 40 Gbps. 14일 환불 보장.