Vibe Coderたちは、エンジニアリングが置き去りにしたルールレイヤーを作り直している

Q: スキルファイルは安全に使えるのか？

コミュニティ提供のスキルは、インポートする前に読むべきだ。 SnykのToxicSkillsレポート は、スキャンしたコミュニティスキルの36%に少なくとも1つのセキュリティ欠陥があり、13.4%にクリティカルレベルの欠陥があって、プロンプトインジェクションが主要な攻撃メカニズムだったことを発見した。 OWASP Agentic Skills Top 10 は、攻撃面を理解するためのリファレンスフレームワークだ。公式リポジトリや確立されたオープンソースプロジェクトのスキルファイルは、匿名のコミュニティ提供物よりも概してサプライチェーンのリスクが低いが、それでもインポート前にレビューすべきだ。

178,000を超えるGitHubユーザーが、たった1つのmarkdownファイルにスターを付けた。そのファイルはただ、AIにどう振る舞うべきかを教えているだけだ。

4つのルール。Think Before Coding。Simplicity First。Surgical Changes。Goal-Driven Execution。それだけだ。ライブラリもない。フレームワークもない。インストーラーもない。Forrest Changは、LLMのコーディング失敗モードに関するAndrej Karpathyの観察を、たった1つのCLAUDE.mdファイルにまとめた。そしてその後の数か月で、開発者コミュニティはそれを178,000 GitHubスター超へと押し上げた。

そこで起きたことに目を凝らすと、あらゆるエンジニアリング組織が十分な痛みを経た末にいずれ必要だと気づいたものに、よく似て見える。コードがどう書かれるかについての共有された制約のセット。ルールレイヤーだ。かつてはコードレビューのチェックリスト、スタイルガイド、あるいはシニアエンジニアの組織的記憶の中に存在していた類のもの。vibe codingコミュニティは、その同じ規律のずっと軽量な版を見つけた。ルールをmarkdownに書き出し、エージェントがコードを書く前にそれを読ませるのだ。

これは単発の出来事ではない。1つのパターンだ。

要約

エージェント指示のエコシステム（CLAUDE.md、AGENTS.md、共有スキルライブラリ、アクセシビリティエージェント）は、AI支援コーディングのための分散型の品質強制レイヤーになりつつある。
それが応えている品質ギャップは現実のものだ。SnykはClawHubとskills.shの3,984件のスキルをスキャンし、1,467件、つまり36.82%に少なくとも1つのセキュリティ欠陥があり、534件、つまり13.4%に少なくとも1つのクリティカルレベルの問題があることを発見した。
コミュニティの応答は、より多くのルールを作ることであって、このアプローチを捨てることではなかった。そしてVercelからOWASP、Linux Foundationまでの機関が、いまや関与している。

品質ギャップは現実であり、コミュニティはそれを知っている

Bar chart contrasting the share of community AI agent skills with security flaws (36.82%) and critical-level flaws (13.4%) from Snyk's ToxicSkills scan of 3,984 skills

コミュニティのスキルファイルの13.4%にクリティカルなセキュリティ欠陥が含まれている。これは SnykのToxicSkillsレポートによるもので、ClawHubとskills.shの3,984件のスキルをスキャンした後、2026年2月に公開された。36.82%に少なくとも1つのセキュリティ脆弱性があった。76件は完全に悪意のあるもので、そのうち91%はプロンプトインジェクションを配送メカニズムとして使っていた。

より広範なAIコード品質の話も同様だ。CodeRabbitのコードレビューデータの分析によれば、AI支援コードはプルリクエストあたり平均10.83件の問題があり、人間が書いたコードの6.45件と比べておよそ1.7倍多い。GitClearの年次コード調査は、コードクローニングの「4倍の増加」と呼ぶものを報告した。変更行に占める割合が2021年から2024年にかけて8.3%から12.3%へと上昇したのだ。

これらはベンダーの数字なので、その精度には相応の懐疑を持って受け止めてほしい。それでも、方向性としては有用だ。AI支援コーディングは、開発者がその周りに新たなガードレールを築くほどの品質上の圧力を生み出している。

重要なのは、コミュニティがこの情報をもとに何をしたかだ。応答は「スキルファイルは危険だ、使うのをやめろ」ではなかった。それはこうだった。OWASPが Agentic Skills Top 10 （AST10）を立ち上げた。スキルエコシステム版のWeb Application Security Top 10だ。より多くのルール。より多くの構造。非公式なエコシステムのための公式なセキュリティフレームワーク。

それは古典的なエンジニアリングの応答だ。重量級のプロセスを避けようとしがちなコミュニティから出てきたものであってもなお。

現れたエコシステム

Layered diagram of the AI coding rules ecosystem: a behavioral layer (CLAUDE.md), a community aggregation layer (Awesome Skills), a framework layer (Vercel agent-skills), and a standards layer (AGENTS.md)

2026年の前半を通じて、これは孤立したmarkdownファイルの寄せ集めというより、層を成したエコシステムのように見え始めた。

まず振る舞いのレイヤーから始めよう。 Karpathy由来のCLAUDE.md は、LLMのコーディング失敗に関するAndrej Karpathyの観察についてのForrest Chang版を、たった1つの指示ファイルにまとめている。そしていまや178,000 GitHubスター超に位置し、GitHubの歴史上最もスターの多いリポジトリの1つであり、4つの単純なルールを軸に組み立てられたファイルだ。それらのルールが何であるかよりも、それが何を表しているかのほうが興味深い。シニアエンジニアがコードレビュー中に適用するであろう判断を、コードに落とし込もうとする試みだ。

その上にコミュニティの集約レイヤーがある。Antigravity Awesome Skillsは1,595以上のagenticスキルを超え、Claude Code、Cursor、Codex CLI、Gemini CLI、Antigravity、その他のAIコーディングアシスタント向けの再利用可能なプレイブックを集めている。それはこの分野のための、足の速い共有ライブラリのように機能する。標準化委員会がPDFではなくGitHubを通じて動いていたら生み出すような類のものだ。

それからフレームワークが登場した。Vercelは vercel-labs/agent-skills を公式の組織リポジトリにし、いまや28,000スターだ。React Best Practicesスキルだけでも、8つのパフォーマンス重視のカテゴリにわたる40以上のルールを含んでいる。waterfall、バンドルサイズ、サーバーサイドのパフォーマンス、クライアントサイドのデータフェッチ、再レンダリングの最適化、レンダリングのパフォーマンス、そしてJavaScriptのマイクロ最適化などだ。あなたのデプロイプラットフォームを所有する企業が、AIエージェント向けの公式な品質ルールを出荷するとき、エコシステムはコミュニティの実験から本番のインフラへと卒業したのだ。

そして頂点には標準のレイヤーがある。OpenAIはAGENTS.md仕様を、Linux FoundationのAgentic AI Foundation（AAIF）に、MCP（Anthropic）やGoose（Block）と並んで寄贈した。クロスツール、クロスエージェント、標準化トラックだ。方向性はポータビリティに向かっている。AGENTS.mdは、プロジェクト固有のエージェントガイダンスのための共有された場所をチームに与える。個々のツールがそれらの指示をどう読み込み適用するかでは依然として異なるかもしれないとしても。

これらの部品は、1つの中央集権的に計画されたスタックとして現れたわけではない。需要が現実だったからこそ、収束したのだ。

誰も語っていない側面

An accessibility agent flagging a modal that traps screen readers and missing ARIA roles in AI-generated UI code, with WCAG 2.2 AA checks listed alongside

セキュリティとコード品質のデータは取り上げられる。アクセシビリティの側面はほとんど取り上げられない。

Community-Access/accessibility-agents は2026年2月21日に6つのエージェントで始まった。2026年6月時点では、8つのチームにわたる79の専門エージェント、18の再利用可能なアクセシビリティスキル、WCAG 2.2 AAをターゲットとし、5つのプラットフォーム（Claude Code、GitHub Copilot、Gemini CLI、Codex CLI、そしてMCP互換クライアントに提供できるMCP Server）にわたるサポートを備えている。

このプロジェクトが何であるかを平たく言えば、こうだ。開発者のコミュニティが、AIコーディングツールはデフォルトでアクセシブルでないコードを生成すると判断し（ARIAルールを飛ばし、キーボードナビゲーションを無視し、スクリーンリーダーを閉じ込めるモーダルを作る）、AIが忘れ続けるルールを強制するために79の専門エージェントを構築したのだ。

それは起こるべくして起こった注目すべきことだ。フロントエンドエンジニアは歴史的にアクセシビリティを十分に届けてこなかった。それは締め切りのプレッシャーの下で最初に削られるものだ。accessibility-agentsプロジェクトは、本来ならシニアエンジニアに強制してもらう必要のあるルールを、vibe coderたちが自ら書いていることであり、しかもそれを公開の場で、無償で、5つのサポートされる統合にわたって行っているのだ。

私の読みでは、このプロジェクトはボランティアのアクセシビリティの取り組みとしては異例なほど徹底している。とりわけ、アクセシビリティを後工程のQAの懸念から、コード生成中に実行される再利用可能なエージェント指示へと変えているからだ。

なぜこれは必然だったのか

「スキルファイルはAI向けのREADMEにすぎない」という主張は、どれか1つのファイルだけを見るなら妥当だ。だが、OWASPがエコシステムのためのセキュリティフレームワークを立ち上げ、Vercelが公式の品質ライブラリを出荷し、ボランティアのアクセシビリティプロジェクトが79の専門エージェントへと成長していることを見れば、その主張は成り立たなくなる。

実際に起きていることはこうだ。品質強制は、プロセスを取り除いても消えない。別の形で再び現れる。なぜなら品質の不在はすぐに痛みを生み、その痛みに最も近い人物が、それを源流で修正するからだ。

従来のエンジニアリングの規律（コードレビュー、スタイルガイド、QAゲート、アーキテクチャのガバナンス）は、個々の開発者が時間的プレッシャーの下で飛ばすものを捕捉するために存在する。それはチームとプロセスがあるときに機能する。vibe coderは、その性質上、どちらも持たないことが多い。だから彼らはレビューをエージェントの指示の中にあらかじめ落とし込んだのだ。

CLAUDE.mdはあらかじめ落とし込まれたコードレビューだ。Awesome Skillsは分散型のスタイルガイドだ。AGENTS.mdはガバナンスの標準だ。言葉は変わった。機能は変わっていない。

興味深いのは、制約が再び現れたことではない。それは必然だった。興味深いのは、それらが初回よりも速く、より公開された形で、そして成熟したプロセスを持つ一部のエンジニアリング組織を恥じ入らせるほどの品質レベルで再び現れたことだ。

vibe codingコミュニティは、経営陣からの圧力の下で、しぶしぶエンジニアリングの規律を再発明したわけではない。彼らは壁にぶつかり、それを修正するツールがmarkdownファイル1つ分の距離にあったから、それを築いたのだ。

よくある質問

CLAUDE.mdファイルには何を入れるのか？

AIのための振る舞いの制約だ。避けるべきこと、優先すべきこと、アーキテクチャのルール、セキュリティ上の危険信号、そしてプロジェクト固有の慣習。品質重視の使い方は、ワークフローのショートカットを超える。「テストを通すためにエラー処理を絶対に削除しない」のようなルールが、「常にTypeScriptを使う」と並んで存在する。実際にテストされた例については、まずこちらから始めよう。 Awesome Skillsのコミュニティ集約. Vercelのagent-skills も、もう1つの有力なリファレンスだ。

AGENTS.mdとは何か、CLAUDE.mdとどう違うのか？

AGENTS.mdは、プロジェクト固有のエージェントガイダンスのための汎用的な標準で、OpenAIによってリリースされ、2025年12月にLinux FoundationのAgentic AI Foundationに寄贈された。CLAUDE.mdはClaude Codeのプロジェクトガイダンスファイルだ。両者は目的の点で重なるが、すべてのツールで同一のフォーマットというわけではない。実用的な要点は、チームがエージェント指示を一度書いて、Codex、Cursor、Copilot、Gemini CLI、Claude Codeといったツールにまたがって適応させることがますますできるようになっている、ということだ。

スキルファイルは安全に使えるのか？

コミュニティ提供のスキルは、インポートする前に読むべきだ。 SnykのToxicSkillsレポートは、スキャンしたコミュニティスキルの36%に少なくとも1つのセキュリティ欠陥があり、13.4%にクリティカルレベルの欠陥があって、プロンプトインジェクションが主要な攻撃メカニズムだったことを発見した。 OWASP Agentic Skills Top 10 は、攻撃面を理解するためのリファレンスフレームワークだ。公式リポジトリや確立されたオープンソースプロジェクトのスキルファイルは、匿名のコミュニティ提供物よりも概してサプライチェーンのリスクが低いが、それでもインポート前にレビューすべきだ。

OWASP Agentic Skills Top 10（AST10）とは何か？

OWASPが2026年に策定したスキルエコシステム向けのセキュリティフレームワークで、OWASP Web Application Security Top 10に類似するが、AIエージェントの指示ファイルが生み出す攻撃面に特化して取り組むものだ。Claude Code、Cursor/Codex、VS Codeを含むプラットフォームにわたる、最も重要な10のセキュリティリスクをカバーする。このフレームワークは2026年時点で活発に開発中で、v1.0のリリースは2026年第4四半期に予定されている。

個人プロジェクトを作っているなら、スキルファイルは必要か？

一貫したAIの振る舞いを望む場合のみだ。制約がなければ、AIコーディングツールはコード品質ではなくタスク完了に最適化する。それは、重複したロジック、欠落したエラー処理、アクセシブルでないUIコンポーネントを生み出すまではうまく機能する。オーバーヘッドは低い。プロジェクトあたり1ファイルで、AIが何を繰り返し間違えるかを発見しながら保守していく。Karpathy由来のルールは妥当な出発点だ。コミュニティのスキルライブラリを使えば、ドメイン固有のルール（セキュリティ、アクセシビリティ、言語のイディオム）をゼロから書くことなく取り込める。