← AI開発 資料アーカイブ
スキルマニュアル

AIエージェント時代のスキル完全マニュアル v2(DOCX「神」版)

元ファイル: スキルマニュアル v2 神.docx

要約

f13806249e8e(Markdown版)と同一内容のスキル完全マニュアルv2のDOCX版。スキル=人間の仕事をAIに移管したものという定義、仕事の5ステップ、基盤/専門/メタの3層構造、ゴールからの逆算、作る/勝手に作られるの2フェーズ、知識×リスクの2軸、型別の作り方を解説する。配布・読み物用の整形済みドキュメント。

要点

スキルSKILL.mdマニュアルDOCX3層構造リスク等級

スキルとは何か — AIエージェント時代のスキル完全マニュアル v2

作成日: 2026-04-17
対象: AIを活用したい全ての人(技術レベル不問)
v1→v2: AI側の分類 → 人間の仕事側からの分類に主語を変更

はじめに

「スキルを作りたいんですけど、どうしたらいいですか?」

この質問に、今まで良い答えがなかった。公式ドキュメントを見ても SKILL.md の書き方しか載っていない。「何を」スキルにすればいいのかがわからない。

このマニュアルは、あなたの仕事のどこがスキルになるのかを見つけるためのもの。

第1章: スキルの本質

スキルとは何か

人間がやっている仕事の一部を、AIでもできるように移管したもの。

これだけ。

スキルは「AIにできることを増やす」のではなく、**「あなたがやっている仕事をAIに渡す」**行為。だからスキルの中身は、あなたの仕事そのもの。

仕事の4ステップ

あらゆる仕事はこの5ステップで回っている:

集める → 考える → 作る → 確かめる → 渡す

ステップ やっていること 人間の道具
集める 情報を探す、データを取る、人に聞く ブラウザ、検索エンジン、ヒアリング
考える 分析する、計画する、判断する ノート、ホワイトボード、頭の中
作る 文書・資料・成果物を作る Word、Excel、PowerPoint
確かめる チェックする、レビューする、品質を検証する チェックリスト、レビューツール、目視確認
渡す 共有する、連絡する、調整する メール、チャット、会議

「確かめる」を飛ばして「渡す」人が多い。でも仕事の品質はここで決まる。 請求書の金額を確認する、LPの誤字をチェックする、コードをレビューする。人間がやっている「確かめる」作業こそ、AIに任せると効果が大きい。ミスを見つけるのはAIの方が得意だから。

この5ステップのどこかに、あなたが毎回同じことをやっている場所がある。そこがスキルになる。

技術的にはSKILL.mdファイル

スキルの実体は SKILL.md というファイル。「この仕事はこうやる」と書いてある指示書。

my-skill/

├── SKILL.md ← メインの指示書(必須)

├── scripts/ ← 実行スクリプト(任意)

├── references/ ← 参考ドキュメント(任意)

└── assets/ ← テンプレート等(任意)

AIがこのファイルを読むと、その仕事ができるようになる。

2026年4月現在、Agent Skills というオープンスタンダードに30以上のツール(Claude Code / Codex / Cursor / Gemini CLI / GitHub Copilot 等)が対応。一つのSKILL.mdを書けば、複数のツールで使い回せる。

第2章: あなたの仕事から見たスキルの種類

2-1. 基盤スキル — 全員が作るべきもの

職種に関係なく、ビジネスをやる全員が毎日やっている仕事がある。

Microsoftが30年間変えていない主要アプリ(Word / Excel / PowerPoint / Outlook)は、人間の仕事の基本動作そのもの。これに「集める」「考える」「確かめる」を加えた7つの動作が、全てのビジネスの基盤になっている。

基本動作 人間の道具 AIスキルにすると
集める ブラウザ、検索 リサーチスキル 競合調査、ニュース収集、市場分析
考える ノート、会議 分析・計画スキル データ分析、企画立案、要件整理
書く Word 文書生成スキル 議事録、報告書、台本、記事
計算・管理する Excel データ処理スキル 経費精算、請求書、売上集計、在庫管理
伝える・見せる PowerPoint プレゼンスキル スライド作成、LP制作、提案資料
確かめる チェックリスト、レビューツール レビュー・品質チェックスキル LP校正、コードレビュー、請求書の金額確認、チラシの整合性チェック
やりとりする Outlook / Teams コミュニケーションスキル メール返信、日程調整、タスク振り分け

なぜ「確かめる」が基盤スキルか? 「作る」と「渡す」の間には必ずチェックが入る。請求書を作ったら金額を確認する。LPを作ったら誤字をチェックする。スライドを作ったらデザインを見直す。この「確かめる」を飛ばすと事故が起きる。そしてAIはミスを見つけるのが得意。人間が目視で1時間かけるチェックを、AIは数秒で完了する。だからレビュー系スキルは最もROIが高い基盤スキルの一つ。

ポイント: この7つは職種を問わない。社長もフリーランスもエンジニアもデザイナーも、全員がやっている。だからここからスキルを作り始める。

「毎日メールに30分使ってる」→ メール返信スキル
「毎月同じ請求書を作ってる」→ 請求書スキル
「毎回同じリサーチを繰り返してる」→ リサーチスキル
「作った後に毎回同じ項目をチェックしてる」→ レビュースキル

2-2. 専門スキル — あなたの職業で決まるもの

基盤の6動作はみんな共通。でも「何を書くか」「何を作るか」「何を調べるか」は職種で全然違う。

デザイナーはAdobeを使う。開発者はVSCodeを使う。動画クリエイターはPremiere Proを使う。使う道具が違うということは、必要な知識体系が違うということ。

専門領域 専門の道具 AIスキルにすると 必要な知識
映像制作 Premiere Pro, After Effects 動画編集、テロップ自動生成、サムネ作成 映像編集の知識
デザイン Figma, Photoshop バナー作成、LP デザイン、ブランド設計 デザインの知識
開発 VSCode, Terminal コードレビュー、テスト自動化、デプロイ プログラミングの知識
SNSマーケ 各SNS, 分析ツール 投稿自動化、競合分析、エンゲージメント分析 マーケティングの知識
コンサル ヒアリングシート, 診断ツール 提案書生成、課題分析、ROI計算 業界・経営の知識
EC ショッピングカート, CRM 商品説明文、レビュー分析、在庫アラート EC運営の知識
教育 LMS, 動画講座 マニュアル自動生成、テスト作成、進捗管理 教育設計の知識

なぜ専門スキルが分かれるのか?

医者と弁護士はなぜ別の職業か。必要な知識が全く違うから。解剖学を知っていても裁判はできない。民法を知っていても手術はできない。

AIスキルも同じ。「YouTube台本を書くスキル」と「コードレビューするスキル」は、必要な知識が完全に別物。だから別のスキルになる。

専門スキルはゴールから逆算して決まる。 何を達成したいかが明確になれば、必要な専門スキルが自動的に特定される(→ 第3章)。

2-3. メタスキル — スキルを管理するスキル

スキルが20個を超えてくると、スキル自体を管理する仕事が発生する。

メタ動作 AIスキルにすると いつ必要か
スキルを作る スキル作成フレームワーク 新しい業務をスキル化する時
品質を管理する レビュー、テスト、監査 スキルの品質が落ちてきた時
複数AIを束ねる Agent Teams、オーケストレーション AIを並列で走らせる時
スキルを自動生成する スキルが勝手に作られる仕組み フェーズ2の世界(→ 第4章)

最初は不要。 基盤スキルと専門スキルを10〜20個作ってから考えればいい。

まとめ: 3層構造

┌──────────────────────────────────┐

│ メタスキル(上級者向け) │ ← スキルが20個超えてから

│ スキルを作る・管理する・束ねる │

├──────────────────────────────────┤

│ 専門スキル(職種による) │ ← ゴールから逆算して決まる

│ 映像/デザイン/開発/マーケ/... │

├──────────────────────────────────┤

│ 基盤スキル(全員共通) │ ← まずここから作る

│ 集める/考える/書く/ │

│ 計算する/伝える/確かめる/やりとりする │

└──────────────────────────────────┘

第3章: ゴールが決まればスキルが決まる

ゴール→プロセス→タスク→エージェント→スキル

夢・目標(ゴール)

↓ ゴールが確定する

プロセス

↓ プロセスが確定する

タスク

↓ タスクが確定する

エージェント(担当者)

↓ エージェントが確定する

スキル(そのエージェントが持つ能力)

これはTERUが数十万回のAI対話から見つけた階層構造。「ゴールが決まればすべてが決まる」の具体形。

例: 年商1億をデジタルコンテンツで達成したい

ゴール: 年商1億

プロセス: SNS集客 → 教育 → 販売 → サポート

タスク: X投稿 / YouTube台本 / LP制作 / 決済 / 請求書 / ...

エージェント: マーケター / コンテンツ制作者 / 事務

スキル:

基盤: メール返信、日程調整、経費精算、請求書作成

専門: x-auto-poster、youtube台本、LP制作、決済管理

ゴールが変われば、必要なスキルも変わる。 5億なら5億のスキルセット。100億なら100億のスキルセット。

スキルは何に依存するか

スキルは3つに依存している:

  1. 人に依存する — その人の専門領域・得意分野がスキルの中身になる

  2. プロジェクトに依存する — プロジェクトごとに必要なスキルが変わる

  3. タスクに依存する — タスクの粒度でスキルの範囲が変わる

1つのエージェントに何個のスキルを入れていいか

たくさん入れていい。

年商5億円クラスのデジタルビジネスなら、おそらくエージェントは3〜4体で足りる。1体あたり100個のスキルを持っていても、AIは集中力を切らさずに仕事を捌ける。

人間の場合、100個のスキルを使いこなすのは無理。でもAIは全てのスキルの手順を正確に記憶し、必要な時に必要なスキルだけ呼び出せる。

ただし注意: スキルは数が多ければいいわけではない。 100個のスキルを持つということは、100個を保守する責任も持つということ。API変更、品質劣化、重複整理が発生する。必要なのは「数」ではなく「再利用できること」「品質が保てること」。

第4章: スキルの2つのフェーズ

フェーズ1: スキルは「作るもの」

最初の段階。自分が繰り返しやっている作業を見つけて、手順に書き起こして、AIに渡す。これがスキル作成の基本。

やることは4つだけ:

  1. 洗い出す — 自分が毎日やっている仕事を全部書き出す

  2. 手順を書く — その中で繰り返しているものをSKILL.mdに書く

  3. 動かす — AIに読み込ませて実際にやらせてみる

  4. 直す — うまくいかなかったところを修正する。3回使えば安定する

「何を洗い出すか」が最初の壁。 自分の仕事を客観的に見る方法はこう:

Step 0: 仕事を「集める→考える→作る→確かめる→渡す」の5ステップで整理する

- 1週間、自分の作業を記録してみる

- 各ステップに何時間使っているか大まかに把握する

Step 1: 繰り返しを見つける

- 「3回以上同じことをやっている」作業に印をつける

- 「なんでこれ毎回やってるんだろう」と思ったらそれがサイン

- 「うざい」「またこれか」と感じる作業は最有力候補

Step 2: 優先順位をつける

- 「売上に直結する」作業 → ROIが高い。優先

- 「うざくて時間を食う」作業 → 解放感が大きい。優先

- 「売上にも関係ないし、たまにしかやらない」→ 後回し

よくある間違い: 「一番難しい仕事」からスキル化しようとする。違う。一番簡単で一番繰り返しているものから始める。請求書の作成、定型メールの返信、毎週のレポート。こういう「手順が決まりきっている仕事」が最初の1個に最適。

もう一つの間違い: いきなり完璧なスキルを作ろうとする。違う。最初は雑でいい。動けばいい。3回使って直して、5回使って調整して、10回使ったら完成。スキルは育てるもの。

フェーズ2: スキルは「勝手に作られるもの」

上級の段階。ここに来るまでにフェーズ1で20〜30個のスキルを作った経験が必要。

フェーズ2では、新しいプロジェクトが立ち上がった時に:

具体例で考える:

状況: 新しくFacebook広告を回すプロジェクトが立ち上がった

フェーズ1の人:

「Facebook広告のスキルが必要だな。作るか」

→ 自分でリサーチして、手順を書いて、テストして、完成(2〜3日)

フェーズ2の人:

「Facebook広告プロジェクト開始」と宣言する

→ システムが既存スキル(SNS投稿スキル、広告分析スキル)を参考に

→ Facebook広告用のスキルを自動生成する

→ 人間は「これでOK」と承認するだけ(30分)

なぜフェーズ2が可能なのか? ゴールが決まればプロセスが決まり、プロセスが決まればタスクが決まり、タスクが決まれば必要なスキルが決まる(第3章の階層)。この逆算が自動化できるなら、スキル生成も自動化できる。

見えない壁

フェーズ1からフェーズ2への移行には 見えない壁 がある。壁の正体は「抽象度の違い」。

フェーズ1は「具体的な手順を書く」作業。フェーズ2は「スキルを生成する仕組みを設計する」作業。やっていることのレベルが根本的に違う。

フェーズ2が成立する4つの条件(Claude × Codex ディベートでの知見):

条件 なぜ必要か 具体的には
仕様が明確 何を入力して何を出力するかわからなければ、自動で作れない 入力/出力/副作用をスキルごとに定義する
テストできる 自動生成されたスキルが正しいかどうか検証する手段がないと、壊れたスキルが量産される 各スキルにテストケースを持たせる
権限が管理されている 自動生成されたスキルが勝手にお金を送金したり、データを消したりしたら終わり リスク等級に応じた承認フローを設計する
ロールバックできる おかしなスキルが生成されたら即座に戻せないと事故が拡大する バージョン管理 + 自動ロールバック

フェーズ1で「良いスキルとは何か」を体で覚えた人だけが、フェーズ2の設計ができる。 なぜなら、「何がOKで何がNGか」の判断基準を持っていないと、自動生成されたスキルの品質を評価できないから。

第5章: スキル作成の実践ガイド

5-1. まず基盤スキルから始める

「何から作ればいいですか?」

この質問への答えはシンプル: あなたも毎日 Word / Excel / PowerPoint / メールを使っている。その中で毎回同じことやってるやつ、それをスキルにしてください。

もう少し具体的に言うと、7つの基本動作ごとに「最初の1個」として作りやすいものがある:

基本動作 最初の1個として作りやすいもの なぜ作りやすいか
集める 毎朝やっているニュースチェック、週次の競合調査 「どこを見るか」が決まっている
考える 会議前のアジェンダ整理、プロジェクトの計画書 テンプレートがある
書く 議事録のテンプレ作成、毎月の報告書 構成が毎回同じ
計算・管理 経費精算、請求書、売上集計 手順が決まりきっている
伝える・見せる 週次報告のスライド、クライアント向け提案資料 フォーマットが固定
確かめる LPの誤字チェック、請求書の金額確認、公開前の最終チェック チェック項目を列挙するだけ
やりとり 定型メールの返信、日程調整の往復 テンプレートが使える

おすすめの最初の1個: 「手順型」の「計算・管理する」スキル。理由は3つ:

  1. 手順が完全に決まっている(曖昧さがない)

  2. 入力と出力が明確(数字 → 帳票)

  3. ミスがあれば数字でわかる(検証しやすい)

毎月作っている請求書、毎週やっている売上集計、毎回同じフォーマットの経費精算。このどれかが最初の1個に最適。

5-2. 型ごとの作り方

スキルは「どんな仕事か」で作り方が全然違う。料理のレシピを書くのと、品質検査のチェックリストを書くのは別物。だから型を見極めてから作り始める。

型の見極め方: あなたのその仕事、一言で言うと何をしている?

一言で言うと 作り方の核心
「毎回同じ手順を踏んでる」 手順型 ステップを番号で書く
「情報を集めてまとめてる」 調査型 「どこを見て何を集めるか」を書く
「何かを作り出してる」 制作型 正解テンプレートを1つ渡す
「出来上がったものをチェックしてる」 チェック型 OK/NGの基準を列挙する
「数字やデータを処理してる」 管理型 入力→処理→出力を定義する
「人に連絡・調整してる」 連絡型 テンプレートと判断基準を書く

以下、型ごとの詳しい作り方:

手順型(毎回同じステップでやっている仕事)

一番簡単。最初にやるべき。

作り方:

  1. その仕事のステップを番号で書き出す

  2. 各ステップの入力と出力を明記する

  3. 「もし○○なら」の分岐を書く

---

name: monthly-invoice

description: 毎月の請求書を作成する。「請求書作って」「インボイス」で発火。

---

# 月次請求書作成

## 手順

1. Googleスプレッドシートのテンプレートをコピーする

2. 宛先・金額・明細を入力する

3. PDFにエクスポートする

4. メールで送信する

## 入力

- クライアント名

- 請求金額

- 明細項目

## 出力

- PDF請求書

- 送信済みメール

調査型(情報を集めてまとめる仕事)

作り方:

  1. 「どこを見るか」(情報源)を列挙する

  2. 「何を集めるか」(収集項目)を明記する

  3. 「どうまとめるか」(出力フォーマット)を決める

---

name: competitor-research

description: 競合リサーチ。「競合調べて」「リサーチして」で発火。

---

# 競合リサーチ

## 情報源

- X (Twitter) の投稿

- YouTube チャンネル

- 公式サイト

## 収集項目

- 投稿頻度、エンゲージメント率

- コンテンツのテーマ・切り口

- 価格帯・提供サービス

## 出力

- Markdownレポート(要約 + データ表)

制作型(何かを作り出す仕事)

作り方:

  1. 正解のテンプレートを1つ渡す(これが最も重要)

  2. 「このクオリティで作れ」と指定する

  3. 品質基準を明記する

---

name: youtube-script

description: YouTube台本を作成する。参照テンプレートに従う。

---

# YouTube台本作成

## 参照テンプレート

assets/best_script_example.md を参照。このクオリティで書くこと。

## 構成

1. フック(最初の5秒で興味を引く)

2. 問題提起

3. 解決策(3つ)

4. まとめ + CTA

## 品質基準

- 1本3000〜5000字

- 口語体で書く

- 専門用語は中学生でもわかる言葉に置き換える

チェック型(品質を確認する仕事)

作り方:

  1. チェックリストを書く

  2. OK / NG の基準を明確にする

  3. NGの場合の対応を書く

---

name: lp-review

description: LPの品質チェック。「LP確認して」「レビューして」で発火。

---

# LPレビュー

## チェックリスト

- [ ] ファーストビューで何を売っているか3秒でわかるか

- [ ] CTAボタンは目立つか

- [ ] 価格は明記されているか

- [ ] スマホ表示で崩れていないか

- [ ] 誤字脱字はないか

## 判定

- 全項目OK → 「問題なし」

- NG項目あり → 具体的な修正箇所を指摘

管理型(データを処理・管理する仕事)

作り方:

  1. 入力(何のデータ)を定義する

  2. 処理(何をするか)を書く

  3. 出力(どこに保存するか)を決める

連絡型(人とやりとりする仕事)

作り方:

  1. テンプレートを用意する

  2. 判断基準を書く(いつ何を返すか)

  3. エスカレーション条件を書く(人間に回すケース)

5-3. SKILL.mdの基本構造

---

name: my-skill # スラッシュコマンド名

description: | # AIが自動判断に使う説明

このスキルの説明。

「こういう言葉」で発火する。

user-invocable: true # ユーザーが/で呼べるか

---

# スキル名

## やること

1. ステップ1

2. ステップ2

3. ステップ3

## ルール

- こういう場合はこうする

- こういう場合はやらない(NOT for: ○○)

## 出力形式

- ファイル名: xxx

- 保存先: xxx

5-4. 配置場所

使い方 配置先
自分だけが使う ~/.claude/skills/my-skill/SKILL.md
プロジェクトで共有する .claude/skills/my-skill/SKILL.md
チーム全体で使う Enterprise管理設定

5-5. 良いスキルの条件

  1. 500行以内 — 長すぎるとAIが読み切れない

  2. descriptionが具体的 — AIが「いつ使うか」を判断する唯一の情報源

  3. トリガーワードを明記 — 「請求書作って」「インボイス」「invoice」で発火、と書く

  4. やらないことも書く — 「NOT for: 新規ドキュメント作成」

  5. 出力形式が明確 — 何をどこに保存するか

  6. 正解テンプレートがある — 制作型は特に重要。お手本を渡す

5-6. 重要な注意: パッシブ vs オンデマンド

Vercelの評価で重要な知見:

常にロードされているルール(CLAUDE.md等)が100%の精度。オンデマンドスキルは最大53%。

AIは「いつスキルを呼び出すか」の判断がまだ苦手。だから:

第6章: なぜこう分類するのか — 深掘り

この章は「なぜ第2章の分類がああなっているのか」を解説する。分類の理由がわからないと、自分で応用できない。

6-1. 人間の専門職はなぜ分かれるのか

医者と弁護士はなぜ別の職業か?「そりゃ違う仕事だから」では答えになっていない。なぜ「違う仕事」として分かれたのかが本質。

理由 医者 弁護士 経理
知識が全く違う 解剖学・薬理学 民法・刑法 簿記・税法
ミスの致命度が違う 人が死ぬ 人が刑務所に入る 会社が税務調査に入る
だから免許/資格がいる 医師免許 弁護士資格 税理士資格
他の人に代わりにやらせたら 患者が死ぬかも 被告が負けるかも 脱税になるかも

専門職が分かれる本質は2つ:

  1. 知識体系の独立性 — 解剖学を知っていても裁判はできない。民法を知っていても手術はできない。知識が根本的に異なるから、同じ人が両方やるのは非効率(もしくは不可能)

  2. 判断の不可逆性 — ミスした時のダメージが致命的だから、専門訓練を受けた人にしかやらせない。だから免許制度がある

これはAIスキルにもそのまま当てはまる。 YouTube台本を書くスキルとコードレビューをするスキルは、必要な知識が完全に別物。請求書を作るスキルと画像を生成するスキルも、知識体系が違う。だから別のスキルになる。

そして、請求書の金額を間違えるのと画像の色味を間違えるのでは、ダメージの大きさが全く違う。だから「どこまでAIに任せるか」のルールも変わる。

6-2. AIスキルの本質的な2軸

スキルの性格を決めるのは、突き詰めるとこの2つ:

軸A: 知識(何を知ってないとできないか)

知識の種類 説明 スキル化の難易度
公開知識 ネットに載っている一般知識 Web検索、ニュース収集、一般的なテンプレ作成 簡単。誰でも作れる
業界知識 特定業界の専門知識 医療用語の文書作成、法律文書の校正、金融レポート 中。その業界の人が作る
社内知識 その組織だけが持つ知識 社内の承認フロー、独自の請求ルール、社内用語 難。その会社の人しか知らない
個人知識 その人だけが持つ知識 文体の好み、判断の癖、「こういう時はこうする」 最難。本人の頭の中にしかない

知識が深いほど、スキル化の難易度が上がる。 公開知識のスキル(「ニュースを集めて」)は今日作れる。個人知識のスキル(「私の文体で書いて」)は、自分の判断基準を言語化するところから始まる。

だからまず公開知識のスキルから作る。 社内知識・個人知識のスキルは、作る過程で「自分が何を知っているか」を棚卸しすることになる。これ自体が価値。

軸B: リスク(ミスったらどうなるか)

リスク等級 ミスった時のダメージ AIへの任せ方
R0 やり直せる すぐ直せる、影響が自分の中で閉じる 文章の誤字、画像の再生成、下書き 全自動でOK。AIに任せきり
R1 手間がかかる 直せるけど時間がかかる レポートの構成ミス、スライドの作り直し AIが作って人間がさっと確認
R2 お金に関わる 金銭的な損失が出る 請求書の金額間違い、広告費の誤設定 AIが作って人間が必ず確認
R3 取り返しがつかない 法務・信用・人命に関わる 個人情報漏洩、本番環境の破壊、契約書の誤記 AIは下書きのみ。実行は人間

リスクが高いスキルほど、人間のチェックを挟む設計にする。 R0は全自動でいい。R3は絶対に人間が最終確認する。この使い分けを間違えると事故が起きる。

よくある間違い: 「AIにお任せ」で全部R0扱いにする。請求書の金額もメールの送信先もAI任せにして、間違った金額の請求書が飛んだり、関係ない人にメールが行ったりする。スキルを作る時に「これはRいくつか?」を最初に決める。

6-3. v1の3軸分類の問題点(LLMディベートの結果)

v1ではマニュアルの最初のバージョンとして「ドメイン」「トリガー」「自律度」の3軸で分類した。Claude と Codex (GPT-5.2) のディベートで以下の問題が指摘された:

問題1: トリガーは分類ではなく設定。
同じ請求書スキルが「手動」でも「毎月1日に定時実行」でも動く。いつ動くかはスキルの本質じゃなくて後から付ける設定。人間で言えば、経理担当者は「経理の専門家」であって「毎月1日に動く人」ではない。起動タイミングは属性であって分類ではない。

問題2: ドメインの定義が混在。
「開発」は仕事の種類だが「Google連携」は接続先。「メタ統治」は管理レイヤー。同じ軸に違う粒度のものを混ぜていた。人間の職業分類で「エンジニア」「マーケター」「Microsoft使う人」「管理職」を同列に並べるようなもの。粒度が揃っていない。

問題3: 自律度が曖昧。
「L3代理人」と「L4指揮者」の違いは、実際には「人間の承認がいるか」「ミスのダメージはどれくらいか」で決まる。「任せ具合」という感覚的な基準では設計に使えない。

Codex(GPT-5.2)の結論:
「能力(何ができるか)」と「統治(どこまで許すか)」を分けるべき。v1はこの2つを混ぜているから壊れる。能力はスキルの本体。統治はスキルにかけるルール。別物。

6-4. 整理: 分類 vs 設定 vs 統治

この3つは別々に考える:

項目 それは何か 決めるタイミング
分類(スキルの性格) 何の知識が必要で、何をするスキルか スキルを設計する時 基盤/書く + 知識:社内
設定(起動方法) いつ、どうやって起動するか スキルを配置する時 手動 / 毎朝9時 / イベント連鎖
統治(許可のルール) どこまで自動でやっていいか スキルのリスクを評価した時 R0:全自動 / R2:人間確認必須

v1はこの3つを全部「分類」として扱っていた。 v2ではこう分ける:

こうすることで「このスキルは基盤の『書く』型で、毎朝9時に定時実行で、リスクR1だから人間がさっと確認する」と、3つの独立した判断ができるようになる。

第7章: ツール別の違い

特徴 Claude Code Codex Cursor Cline
スキルファイル SKILL.md SKILL.md .mdc/.md .md/.txt
設定ファイル CLAUDE.md AGENTS.md .cursor/rules/ .clinerules/
自動発動 description判定 description判定 4モード 条件付きルール
サブエージェント context: fork Subagents
手動呼び出し /skill-name /skills @rule-name

Claude Codeが最も高機能。ただし基本的なSKILL.md形式は共通で、どのツールでも使える。

第8章: スキル化チェックリスト

Step 0: 仕事の全体像を把握する

Step 1: 基盤スキルから3つ選ぶ

Step 2: 型を判断して作る

Step 3: 動かして改善する

Step 4: 専門スキルに進む(ゴールから逆算)

付録A: v1の3軸分類(技術的な参考資料)

v1で提示した3軸分類は、AIの技術仕様を理解する際の参考として有用:

軸1: ドメイン(9分類)

開発 / コンテンツ制作 / リサーチ / ビジネス業務 / SNSマーケ / ドキュメント / Google連携 / 知識管理 / メタ統治

軸2: トリガー(5種)

手動 / キーワード / 定時 / イベント / 連鎖

軸3: 自律度(5段階)

L1道具 / L2助手 / L3代理人 / L4指揮者 / L5自己進化

これらは「スキルの技術的属性」として理解しておくと、SKILL.mdの設計時に役立つ。ただし、スキルを作る際の出発点は「あなたの仕事のどこか」であり、この技術分類ではない。

付録B: 業界のスキル分類フレームワーク

フレームワーク 提唱者 分類軸
AI Agent Capabilities Periodic Table Digital Twin Consortium 知覚/認知/学習/行動/対話/統治の6領域
3段階アーキテクチャ分類 Lenny Rachitsky 決定的自動化 / 推論行動 / マルチエージェント
awesome-agent-skills VoltAgent (GitHub) 1,184+スキルのカテゴリ分類
OpenClawレジストリ Linux Foundation管理 13,700+スキル登録

付録C: 参考リンク

↑ トップへ戻る