元ファイル: システム要件定義の分析と汎用化方法/非エンジニア向け Claude Code 自動構築における.md

非エンジニア向け Claude Code 自動構築における

リスク・破壊・コンテキスト浪費完全対策ガイド

作成者: Manus AI
対象: 非エンジニア・AI初心者が要件定義〜SDD自動構築を行うすべてのケース
根拠: 既存対策ファイル群（7ファイル）の全棚卸し診断 + Anthropic公式資料 + 業界標準

0. 診断結果サマリー：既存対策の現状評価

既存ファイル群（enhanced_development_failure_risk_loop_report.md、research_failure_risk_mitigation_report.md、review_test_reresearch_loop_templates_complete.md 等）を全棚卸しした結果、以下の評価となった。

対策カテゴリ	既存カバー率	評価	主な抜け穴
外部API・規約リスク	★★★★☆	充実	規約変更の定期監視が未定義
破壊的操作の防止（dry-run・sandbox）	★★★★☆	充実	kill switchの具体的実装手順が薄い
Codex/Opus二重レビュー	★★★★★	完備	—
RYGゲート判定	★★★★★	完備	—
コンテキスト枯渇・セッション切断	★★☆☆☆	不足	CLAUDE.md・進捗ファイル設計が未定義
フェーズ分割・タスク粒度管理	★★★☆☆	やや不足	1フェーズの上限サイズが未定義
コスト管理・トークン浪費防止	★☆☆☆☆	ほぼ未対策	予算上限・早期停止条件が未定義
復旧手順（rollback・バックアップ）	★★★★☆	充実	復旧時間目標（RTO）が未定義
素人の誤判断防止	★★★☆☆	やや不足	「完了と思って壊す」パターンへの対策が薄い
再リサーチループ	★★★★★	完備	—

結論：3つの重大な抜け穴が存在する。
コンテキスト枯渇対策、コスト管理、「完了誤認による破壊」への対策が不十分であり、これらが「システムが完成しないままお金とコンテキストが無駄になる」ケースの主因となっている。

1. リスク・破壊パターンの完全分類

非エンジニアが要件定義〜SDD自動構築で失敗するパターンは、次の5層に分類できる。

層A：設計前の失敗（最上流）

設計に入る前の段階で発生する失敗であり、後続のすべてに影響する。

パターン	何が起きるか	既存対策	追加対策
A-1 曖昧な入力	「Substackを自動化したい」だけで実装が始まる	Intent Sheet	入力受付時の必須5項目チェック
A-2 実現不可能な要件	APIがない・規約違反・技術的に不可能なものを要件にする	リサーチV1	NO-GO条件の事前チェックリスト
A-3 スコープ肥大化	「ついでにこれも」が積み重なり全体が壊れる	ユースケースレベル判定	スコープ凍結宣言（Scope Freeze）の明示

層B：文書構築中の失敗

要件定義書・仕様書・SDD等を作成する過程で発生する失敗。

パターン	何が起きるか	既存対策	追加対策
B-1 根拠なし要件	Evidence Matrixに裏付けがないまま要件が書かれる	Evidence Matrix必須化	根拠IDなし項目の自動フラグ
B-2 テスト不能要件	「安全に動くこと」のような検証できない要件	テスト計画テンプレート	受入基準の数値化ルール
B-3 矛盾要件	要件間で矛盾が発生し実装が詰まる	Codexレビュー	矛盾検出チェックリスト
B-4 コンテキスト枯渇	会話が長くなりAIが前の指示を忘れる	未対策（重大）	CLAUDE.md設計・進捗ファイル

層C：実装中の失敗

Claude Codeが実際にコードを書く段階で発生する失敗。

パターン	何が起きるか	既存対策	追加対策
C-1 本番環境の破壊	本番DBやAPIを直接操作して壊す	dry-run・sandbox必須	本番接続禁止フラグ
C-2 自動投稿の暴走	承認なしに大量投稿・配信が走る	kill switch・承認キュー	投稿上限カウンター
C-3 認証情報の漏洩	APIキー・パスワードがコードに埋め込まれる	セキュリティ要件	シークレット管理チェック
C-4 フェーズ未完了での次工程	前の機能が壊れたまま次を実装する	RYGゲート	フェーズ完了チェックリスト
C-5 コスト暴走	APIコールが無限ループし課金が膨らむ	未対策（重大）	コスト上限・早期停止条件

層D：検証・レビュー中の失敗

パターン	何が起きるか	既存対策	追加対策
D-1 AI過信	Codex/Opusのレビューを正解として採用する	「仮説扱い」の明示	人間確認必須項目の定義
D-2 完了誤認	「動いた」を「完成した」と誤解して本番投入	やや不足	完了定義チェックリスト
D-3 回帰テスト未実施	修正後に前の機能が壊れたことに気づかない	回帰テスト定義	修正前後の自動比較手順

層E：運用開始後の失敗

パターン	何が起きるか	既存対策	追加対策
E-1 規約変更	外部サービスの規約が変わり突然使えなくなる	定期監視が未定義	月次規約チェック手順
E-2 API仕様変更	APIのバージョンアップで動かなくなる	依存関係管理	変更通知の受信設定
E-3 復旧不能	壊れたが戻し方がわからない	rollback手順	RTO（復旧時間目標）の定義

2. 最重要：3つの重大な抜け穴と完全対策

抜け穴①：コンテキスト枯渇・セッション切断（最も頻繁に発生）

何が起きるか： 要件定義〜SDD構築は会話が長くなる。Claudeは会話が長くなるにつれて前半の指示を忘れ、矛盾した回答をしたり、同じことを繰り返したり、途中で止まったりする。セッションが切れると、それまでの文脈がすべて失われ、最初からやり直しになる。

既存対策の状態： non_engineer_claude_code_requirements_master_summary.md に「コンテキスト枯渇への言及」はあるが、具体的な防止手順が未定義。

完全対策：CLAUDE.md + 進捗ファイル設計

プロジェクト開始時に必ず CLAUDE.md（Claude Codeがセッション開始時に自動で読むファイル）を作成し、以下を記載する。

# プロジェクト概要
目的：[一文で記載]
現在のフェーズ：[Phase番号と名前]
完了済みフェーズ：[リスト]
次に実施すること：[具体的な次のタスク]
絶対にやってはいけないこと：[禁止事項リスト]

加えて、progress.md を毎フェーズ終了時に更新し、「どこまで完了したか」を外部ファイルに保存する。セッションが切れても、次のセッション開始時に CLAUDE.md と progress.md を読ませるだけで文脈が復元される。

フェーズ分割の上限サイズ：

1つの会話セッションで扱うタスクは「1機能・1成果物・1フェーズ」を上限とする。たとえば「要件定義書を作る」と「仕様書を作る」は別セッションにする。これにより、コンテキスト枯渇が発生しても被害が1フェーズに限定される。

抜け穴②：コスト管理・トークン浪費防止（金銭的損失の直接原因）

何が起きるか： 要件定義の自動構築は、リサーチV1→V2→レビュー→再リサーチのループを繰り返す。このループが収束せずに回り続けると、コンテキストとAPIコストだけが消費され、何も完成しない。特に「Redが解消されないまま再リサーチを繰り返す」パターンが最も危険。

既存対策の状態： コスト管理に関する記述がほぼ存在しない。

完全対策：ループ上限とコスト停止条件

以下の「ループ停止ルール」を全プロジェクトに適用する。

停止条件	内容	判断者
再リサーチ上限	同一Redに対する再リサーチは最大3回まで	AI（自動カウント）
フェーズ時間上限	1フェーズは最大2セッション（それ以上は設計見直し）	人間
ループ収束判定	3回再リサーチしてもRedが解消しない場合は「設計変更」へ移行	AI + 人間
早期停止条件	「実現不可能」と判定されたらその場で停止し代替案を提示	AI

さらに、各フェーズの開始時に「このフェーズで何を完了とするか」を1文で宣言させる。完了条件が不明なまま進めることを禁止する。

抜け穴③：「完了誤認による破壊」（最も気づきにくい）

何が起きるか： 非エンジニアは「AIが動くコードを出力した」＝「完成した」と誤解しやすい。しかし、動くコードと安全に運用できるコードは別物である。この誤解で本番投入し、データが消えたり誤配信が走ったりする。

既存対策の状態： RYGゲートは存在するが、「動いた」を「完成した」と誤解するパターンへの具体的な防止策が薄い。

完全対策：完了定義チェックリスト（Done Definition）

実装完了を宣言する前に、以下の全項目を確認する。

完了定義チェックリスト（Done Definition）
□ dry-runで期待通りの動作を確認した
□ 本番データ・本番APIに一切触れていない
□ 失敗時のrollback手順を実際に試した
□ 誤配信・重複投稿・二重課金が発生しないことをテストした
□ kill switchが機能することを確認した
□ ログが正しく記録されることを確認した
□ 人間の承認なしに本番操作が走らないことを確認した
□ Evidence Matrixの全根拠が最新状態である
□ CodexレビューでのすべてのBlockerが解消されている
□ Opusレビューでの運用リスクがすべてGreenまたはYellowである
□ 未解決のRedが存在しない

この11項目のうち1つでも未チェックの場合、「完了」と宣言してはならない。

3. 既存対策の確認：充実している部分

以下の対策は既存ファイルで充実しており、追加対策は不要である。

Codex/Opus二重レビューの役割分担は enhanced_development_failure_risk_loop_report.md で完全に定義されている。Codexが実装・CI・テスト・破壊的変更を検証し、Opusが要件・運用・事業リスク・代替案を評価する分担は適切である。

RYGゲート判定は research_failure_risk_mitigation_report.md と enhanced_development_failure_risk_loop_report.md の両方で詳細に定義されており、Green条件・Yellow条件・Red条件・NO-GO条件が明確である。

外部API・規約リスクへの対策は research_failure_risk_mitigation_report.md で詳細に定義されており、公式API確認・規約確認・代替手段調査・手動介入点の設計が含まれている。

再リサーチループのテンプレートは review_test_reresearch_loop_templates_complete.md で完備されており、Intent Sheet・Evidence Matrix・Research Brief・Requirement ID Ledgerが揃っている。

4. 完全対策の統合フロー

以上の診断を踏まえ、既存対策と新規追加対策を統合した完全フローを示す。

[開始]
  │
  ▼
【事前設定】CLAUDE.md作成 + progress.md初期化
  │ ← 抜け穴①の対策
  ▼
【Phase 0】入力受付 → Intent Sheet → 必須5項目チェック
  │ ← 層Aの対策
  ▼
【Phase 1】リサーチV1：実現可能性確認
  │ → NO-GO? → 停止 + 代替案提示
  ▼
【Phase 2】ユースケースレベル判定 + スコープ凍結宣言
  │ ← 層A-3の対策
  ▼
【Phase 3】リサーチV2：テンプレート充填
  │ → フェーズ完了チェック → progress.md更新
  ▼
【Phase 4】11成果物の生成
  │ → 根拠IDなし項目フラグ → 矛盾検出チェック
  ▼
【Phase 5】Codexレビュー（実装・テスト・破壊リスク）
  │
  ▼
【Phase 6】Opusレビュー（要件・運用・事業リスク）
  │
  ▼
【RYGゲート判定】
  ├── Green → 完了定義チェックリスト確認 → 合意 → 実装開始
  ├── Yellow → 条件付き進行 + 期限設定
  └── Red → 再リサーチ（最大3回上限）← 抜け穴②の対策
              │
              └── 3回でも解消しない → 設計変更 + 代替案提示

[実装フェーズ]
  │ → 本番接続禁止フラグ確認
  │ → dry-run実施
  │ → kill switch動作確認
  │ → 完了定義チェックリスト（11項目）← 抜け穴③の対策
  ▼
[完了]

5. 月次運用チェック（運用開始後の対策）

システムが稼働し始めた後も、以下の月次チェックを実施する。

チェック項目	頻度	担当
外部サービスの利用規約確認	月1回	AI（自動確認） + 人間（最終判断）
APIバージョン・仕様変更の確認	月1回	AI
ログの異常値確認（エラー率・投稿数）	週1回	AI
kill switchの動作確認	月1回	人間
rollback手順の動作確認	四半期1回	人間
Evidence Matrixの根拠の鮮度確認	月1回	AI

6. 対策の完全性評価（診断後）

上記の追加対策を適用した後の評価。

対策カテゴリ	対策後カバー率	残存リスク
外部API・規約リスク	★★★★★	規約の突然改定（不可抗力）
破壊的操作の防止	★★★★★	なし
Codex/Opus二重レビュー	★★★★★	なし
RYGゲート判定	★★★★★	なし
コンテキスト枯渇・セッション切断	★★★★★	なし
フェーズ分割・タスク粒度管理	★★★★★	なし
コスト管理・トークン浪費防止	★★★★☆	想定外のループ（人間判断で対応）
復旧手順	★★★★★	なし
素人の誤判断防止	★★★★★	なし
再リサーチループ	★★★★★	なし

7. 非エンジニア向け要約：「これだけ守れば壊れない」5つのルール

技術的な詳細を理解しなくても、以下の5つを守るだけで、「お金とコンテキストが無駄になる」リスクを大幅に減らせる。

ルール1：1回の会話で1つのことだけを頼む。
「要件定義書を作って、仕様書も作って、SDDも作って」を一度に頼まない。1つ完了したら次に進む。

ルール2：「動いた」と「完成した」は別物だと覚える。
AIがコードを出力しても、完了定義チェックリストの11項目が揃うまで本番に投入しない。

ルール3：Redが3回解消しなかったら設計を変える。
同じ問題に3回再リサーチしても解決しない場合、その方向性を諦めて別の方法を探す。これが最もコストを節約する判断である。

ルール4：CLAUDE.mdとprogress.mdを必ず作る。
これがあれば、セッションが切れても次の会話で「どこまで進んだか」をAIに伝えられる。

ルール5：本番に触れる前に必ずdry-runを実施する。
dry-runとは「実際には送らない・投稿しない・課金しない」状態でテストすることである。これを省略しない。

参考：既存対策ファイルとの対応関係

本ドキュメントの章	参照した既存ファイル
層A・B・Cの対策	`research_failure_risk_mitigation_report.md`
Codex/Opusレビュー	`enhanced_development_failure_risk_loop_report.md`
RYGゲート	`enhanced_development_failure_risk_loop_report.md`
テンプレート体系	`review_test_reresearch_loop_templates_complete.md`
コンテキスト枯渇（新規追加）	Anthropic公式資料（長時間エージェント設計）
コスト管理（新規追加）	本診断で新規作成
完了定義チェックリスト（新規追加）	本診断で新規作成
月次運用チェック（新規追加）	SRE Google Workbook（カナリアリリース）

非エンジニア向けClaude Code自動構築リスク・破壊・コンテキスト浪費完全対策ガイド

要約

要点

非エンジニア向け Claude Code 自動構築における

リスク・破壊・コンテキスト浪費完全対策ガイド

0. 診断結果サマリー：既存対策の現状評価

1. リスク・破壊パターンの完全分類

層A：設計前の失敗（最上流）

層B：文書構築中の失敗

層C：実装中の失敗

層D：検証・レビュー中の失敗

層E：運用開始後の失敗

2. 最重要：3つの重大な抜け穴と完全対策

抜け穴①：コンテキスト枯渇・セッション切断（最も頻繁に発生）

抜け穴②：コスト管理・トークン浪費防止（金銭的損失の直接原因）

抜け穴③：「完了誤認による破壊」（最も気づきにくい）

3. 既存対策の確認：充実している部分

4. 完全対策の統合フロー

5. 月次運用チェック（運用開始後の対策）

6. 対策の完全性評価（診断後）

7. 非エンジニア向け要約：「これだけ守れば壊れない」5つのルール

参考：既存対策ファイルとの対応関係

非エンジニア向けClaude Code自動構築 リスク・破壊・コンテキスト浪費 完全対策ガイド

要約

要点

非エンジニア向け Claude Code 自動構築における

リスク・破壊・コンテキスト浪費 完全対策ガイド

0. 診断結果サマリー：既存対策の現状評価

1. リスク・破壊パターンの完全分類

層A：設計前の失敗（最上流）

層B：文書構築中の失敗

層C：実装中の失敗

層D：検証・レビュー中の失敗

層E：運用開始後の失敗

2. 最重要：3つの重大な抜け穴と完全対策

抜け穴①：コンテキスト枯渇・セッション切断（最も頻繁に発生）

抜け穴②：コスト管理・トークン浪費防止（金銭的損失の直接原因）

抜け穴③：「完了誤認による破壊」（最も気づきにくい）

3. 既存対策の確認：充実している部分

4. 完全対策の統合フロー

5. 月次運用チェック（運用開始後の対策）

6. 対策の完全性評価（診断後）

7. 非エンジニア向け要約：「これだけ守れば壊れない」5つのルール

参考：既存対策ファイルとの対応関係

非エンジニア向けClaude Code自動構築リスク・破壊・コンテキスト浪費完全対策ガイド

リスク・破壊・コンテキスト浪費完全対策ガイド