← AI開発 資料アーカイブ
要件定義・自動化体系

非エンジニア向けClaude Code自動構築 リスク・破壊・コンテキスト浪費 完全対策ガイド

元ファイル: システム要件定義の分析と汎用化方法/非エンジニア向け Claude Code 自動構築における.md

要約

既存対策7ファイルを棚卸し診断し、要件定義〜SDD自動構築の失敗パターンと対策を統合したガイド(Manus AI作)。Codex/Opus二重レビューやRYGゲートは完備だが、コンテキスト枯渇・コスト管理・完了誤認による破壊の3つが重大な抜け穴と判定し、具体対策を提示する。層A〜Eの失敗分類、統合フロー、月次運用チェック、非エンジニア向け5ルールまでを示す。

要点

リスク対策コンテキスト枯渇コスト管理完了定義dry-runkill switchManus AI

非エンジニア向け Claude Code 自動構築における

リスク・破壊・コンテキスト浪費 完全対策ガイド

作成者: Manus AI
対象: 非エンジニア・AI初心者が要件定義〜SDD自動構築を行うすべてのケース
根拠: 既存対策ファイル群(7ファイル)の全棚卸し診断 + Anthropic公式資料 + 業界標準


0. 診断結果サマリー:既存対策の現状評価

既存ファイル群(enhanced_development_failure_risk_loop_report.mdresearch_failure_risk_mitigation_report.mdreview_test_reresearch_loop_templates_complete.md 等)を全棚卸しした結果、以下の評価となった。

対策カテゴリ 既存カバー率 評価 主な抜け穴
外部API・規約リスク ★★★★☆ 充実 規約変更の定期監視が未定義
破壊的操作の防止(dry-run・sandbox) ★★★★☆ 充実 kill switchの具体的実装手順が薄い
Codex/Opus二重レビュー ★★★★★ 完備
RYGゲート判定 ★★★★★ 完備
コンテキスト枯渇・セッション切断 ★★☆☆☆ 不足 CLAUDE.md・進捗ファイル設計が未定義
フェーズ分割・タスク粒度管理 ★★★☆☆ やや不足 1フェーズの上限サイズが未定義
コスト管理・トークン浪費防止 ★☆☆☆☆ ほぼ未対策 予算上限・早期停止条件が未定義
復旧手順(rollback・バックアップ) ★★★★☆ 充実 復旧時間目標(RTO)が未定義
素人の誤判断防止 ★★★☆☆ やや不足 「完了と思って壊す」パターンへの対策が薄い
再リサーチループ ★★★★★ 完備

結論:3つの重大な抜け穴が存在する。
コンテキスト枯渇対策、コスト管理、「完了誤認による破壊」への対策が不十分であり、これらが「システムが完成しないままお金とコンテキストが無駄になる」ケースの主因となっている。


1. リスク・破壊パターンの完全分類

非エンジニアが要件定義〜SDD自動構築で失敗するパターンは、次の5層に分類できる。

層A:設計前の失敗(最上流)

設計に入る前の段階で発生する失敗であり、後続のすべてに影響する。

パターン 何が起きるか 既存対策 追加対策
A-1 曖昧な入力 「Substackを自動化したい」だけで実装が始まる Intent Sheet 入力受付時の必須5項目チェック
A-2 実現不可能な要件 APIがない・規約違反・技術的に不可能なものを要件にする リサーチV1 NO-GO条件の事前チェックリスト
A-3 スコープ肥大化 「ついでにこれも」が積み重なり全体が壊れる ユースケースレベル判定 スコープ凍結宣言(Scope Freeze)の明示

層B:文書構築中の失敗

要件定義書・仕様書・SDD等を作成する過程で発生する失敗。

パターン 何が起きるか 既存対策 追加対策
B-1 根拠なし要件 Evidence Matrixに裏付けがないまま要件が書かれる Evidence Matrix必須化 根拠IDなし項目の自動フラグ
B-2 テスト不能要件 「安全に動くこと」のような検証できない要件 テスト計画テンプレート 受入基準の数値化ルール
B-3 矛盾要件 要件間で矛盾が発生し実装が詰まる Codexレビュー 矛盾検出チェックリスト
B-4 コンテキスト枯渇 会話が長くなりAIが前の指示を忘れる 未対策(重大) CLAUDE.md設計・進捗ファイル

層C:実装中の失敗

Claude Codeが実際にコードを書く段階で発生する失敗。

パターン 何が起きるか 既存対策 追加対策
C-1 本番環境の破壊 本番DBやAPIを直接操作して壊す dry-run・sandbox必須 本番接続禁止フラグ
C-2 自動投稿の暴走 承認なしに大量投稿・配信が走る kill switch・承認キュー 投稿上限カウンター
C-3 認証情報の漏洩 APIキー・パスワードがコードに埋め込まれる セキュリティ要件 シークレット管理チェック
C-4 フェーズ未完了での次工程 前の機能が壊れたまま次を実装する RYGゲート フェーズ完了チェックリスト
C-5 コスト暴走 APIコールが無限ループし課金が膨らむ 未対策(重大) コスト上限・早期停止条件

層D:検証・レビュー中の失敗

パターン 何が起きるか 既存対策 追加対策
D-1 AI過信 Codex/Opusのレビューを正解として採用する 「仮説扱い」の明示 人間確認必須項目の定義
D-2 完了誤認 「動いた」を「完成した」と誤解して本番投入 やや不足 完了定義チェックリスト
D-3 回帰テスト未実施 修正後に前の機能が壊れたことに気づかない 回帰テスト定義 修正前後の自動比較手順

層E:運用開始後の失敗

パターン 何が起きるか 既存対策 追加対策
E-1 規約変更 外部サービスの規約が変わり突然使えなくなる 定期監視が未定義 月次規約チェック手順
E-2 API仕様変更 APIのバージョンアップで動かなくなる 依存関係管理 変更通知の受信設定
E-3 復旧不能 壊れたが戻し方がわからない rollback手順 RTO(復旧時間目標)の定義

2. 最重要:3つの重大な抜け穴と完全対策

抜け穴①:コンテキスト枯渇・セッション切断(最も頻繁に発生)

何が起きるか: 要件定義〜SDD構築は会話が長くなる。Claudeは会話が長くなるにつれて前半の指示を忘れ、矛盾した回答をしたり、同じことを繰り返したり、途中で止まったりする。セッションが切れると、それまでの文脈がすべて失われ、最初からやり直しになる。

既存対策の状態: non_engineer_claude_code_requirements_master_summary.md に「コンテキスト枯渇への言及」はあるが、具体的な防止手順が未定義。

完全対策:CLAUDE.md + 進捗ファイル設計

プロジェクト開始時に必ず CLAUDE.md(Claude Codeがセッション開始時に自動で読むファイル)を作成し、以下を記載する。

# プロジェクト概要
目的:[一文で記載]
現在のフェーズ:[Phase番号と名前]
完了済みフェーズ:[リスト]
次に実施すること:[具体的な次のタスク]
絶対にやってはいけないこと:[禁止事項リスト]

加えて、progress.md を毎フェーズ終了時に更新し、「どこまで完了したか」を外部ファイルに保存する。セッションが切れても、次のセッション開始時に CLAUDE.mdprogress.md を読ませるだけで文脈が復元される。

フェーズ分割の上限サイズ:

1つの会話セッションで扱うタスクは「1機能・1成果物・1フェーズ」を上限とする。たとえば「要件定義書を作る」と「仕様書を作る」は別セッションにする。これにより、コンテキスト枯渇が発生しても被害が1フェーズに限定される。


抜け穴②:コスト管理・トークン浪費防止(金銭的損失の直接原因)

何が起きるか: 要件定義の自動構築は、リサーチV1→V2→レビュー→再リサーチのループを繰り返す。このループが収束せずに回り続けると、コンテキストとAPIコストだけが消費され、何も完成しない。特に「Redが解消されないまま再リサーチを繰り返す」パターンが最も危険。

既存対策の状態: コスト管理に関する記述がほぼ存在しない。

完全対策:ループ上限とコスト停止条件

以下の「ループ停止ルール」を全プロジェクトに適用する。

停止条件 内容 判断者
再リサーチ上限 同一Redに対する再リサーチは最大3回まで AI(自動カウント)
フェーズ時間上限 1フェーズは最大2セッション(それ以上は設計見直し) 人間
ループ収束判定 3回再リサーチしてもRedが解消しない場合は「設計変更」へ移行 AI + 人間
早期停止条件 「実現不可能」と判定されたらその場で停止し代替案を提示 AI

さらに、各フェーズの開始時に「このフェーズで何を完了とするか」を1文で宣言させる。完了条件が不明なまま進めることを禁止する。


抜け穴③:「完了誤認による破壊」(最も気づきにくい)

何が起きるか: 非エンジニアは「AIが動くコードを出力した」=「完成した」と誤解しやすい。しかし、動くコードと安全に運用できるコードは別物である。この誤解で本番投入し、データが消えたり誤配信が走ったりする。

既存対策の状態: RYGゲートは存在するが、「動いた」を「完成した」と誤解するパターンへの具体的な防止策が薄い。

完全対策:完了定義チェックリスト(Done Definition)

実装完了を宣言する前に、以下の全項目を確認する。

完了定義チェックリスト(Done Definition)
□ dry-runで期待通りの動作を確認した
□ 本番データ・本番APIに一切触れていない
□ 失敗時のrollback手順を実際に試した
□ 誤配信・重複投稿・二重課金が発生しないことをテストした
□ kill switchが機能することを確認した
□ ログが正しく記録されることを確認した
□ 人間の承認なしに本番操作が走らないことを確認した
□ Evidence Matrixの全根拠が最新状態である
□ CodexレビューでのすべてのBlockerが解消されている
□ Opusレビューでの運用リスクがすべてGreenまたはYellowである
□ 未解決のRedが存在しない

この11項目のうち1つでも未チェックの場合、「完了」と宣言してはならない。


3. 既存対策の確認:充実している部分

以下の対策は既存ファイルで充実しており、追加対策は不要である。

Codex/Opus二重レビューの役割分担enhanced_development_failure_risk_loop_report.md で完全に定義されている。Codexが実装・CI・テスト・破壊的変更を検証し、Opusが要件・運用・事業リスク・代替案を評価する分担は適切である。

RYGゲート判定research_failure_risk_mitigation_report.mdenhanced_development_failure_risk_loop_report.md の両方で詳細に定義されており、Green条件・Yellow条件・Red条件・NO-GO条件が明確である。

外部API・規約リスクへの対策research_failure_risk_mitigation_report.md で詳細に定義されており、公式API確認・規約確認・代替手段調査・手動介入点の設計が含まれている。

再リサーチループのテンプレートreview_test_reresearch_loop_templates_complete.md で完備されており、Intent Sheet・Evidence Matrix・Research Brief・Requirement ID Ledgerが揃っている。


4. 完全対策の統合フロー

以上の診断を踏まえ、既存対策と新規追加対策を統合した完全フローを示す。

[開始]
  │
  ▼
【事前設定】CLAUDE.md作成 + progress.md初期化
  │ ← 抜け穴①の対策
  ▼
【Phase 0】入力受付 → Intent Sheet → 必須5項目チェック
  │ ← 層Aの対策
  ▼
【Phase 1】リサーチV1:実現可能性確認
  │ → NO-GO? → 停止 + 代替案提示
  ▼
【Phase 2】ユースケースレベル判定 + スコープ凍結宣言
  │ ← 層A-3の対策
  ▼
【Phase 3】リサーチV2:テンプレート充填
  │ → フェーズ完了チェック → progress.md更新
  ▼
【Phase 4】11成果物の生成
  │ → 根拠IDなし項目フラグ → 矛盾検出チェック
  ▼
【Phase 5】Codexレビュー(実装・テスト・破壊リスク)
  │
  ▼
【Phase 6】Opusレビュー(要件・運用・事業リスク)
  │
  ▼
【RYGゲート判定】
  ├── Green → 完了定義チェックリスト確認 → 合意 → 実装開始
  ├── Yellow → 条件付き進行 + 期限設定
  └── Red → 再リサーチ(最大3回上限)← 抜け穴②の対策
              │
              └── 3回でも解消しない → 設計変更 + 代替案提示

[実装フェーズ]
  │ → 本番接続禁止フラグ確認
  │ → dry-run実施
  │ → kill switch動作確認
  │ → 完了定義チェックリスト(11項目)← 抜け穴③の対策
  ▼
[完了]

5. 月次運用チェック(運用開始後の対策)

システムが稼働し始めた後も、以下の月次チェックを実施する。

チェック項目 頻度 担当
外部サービスの利用規約確認 月1回 AI(自動確認) + 人間(最終判断)
APIバージョン・仕様変更の確認 月1回 AI
ログの異常値確認(エラー率・投稿数) 週1回 AI
kill switchの動作確認 月1回 人間
rollback手順の動作確認 四半期1回 人間
Evidence Matrixの根拠の鮮度確認 月1回 AI

6. 対策の完全性評価(診断後)

上記の追加対策を適用した後の評価。

対策カテゴリ 対策後カバー率 残存リスク
外部API・規約リスク ★★★★★ 規約の突然改定(不可抗力)
破壊的操作の防止 ★★★★★ なし
Codex/Opus二重レビュー ★★★★★ なし
RYGゲート判定 ★★★★★ なし
コンテキスト枯渇・セッション切断 ★★★★★ なし
フェーズ分割・タスク粒度管理 ★★★★★ なし
コスト管理・トークン浪費防止 ★★★★☆ 想定外のループ(人間判断で対応)
復旧手順 ★★★★★ なし
素人の誤判断防止 ★★★★★ なし
再リサーチループ ★★★★★ なし

7. 非エンジニア向け要約:「これだけ守れば壊れない」5つのルール

技術的な詳細を理解しなくても、以下の5つを守るだけで、「お金とコンテキストが無駄になる」リスクを大幅に減らせる。

ルール1:1回の会話で1つのことだけを頼む。
「要件定義書を作って、仕様書も作って、SDDも作って」を一度に頼まない。1つ完了したら次に進む。

ルール2:「動いた」と「完成した」は別物だと覚える。
AIがコードを出力しても、完了定義チェックリストの11項目が揃うまで本番に投入しない。

ルール3:Redが3回解消しなかったら設計を変える。
同じ問題に3回再リサーチしても解決しない場合、その方向性を諦めて別の方法を探す。これが最もコストを節約する判断である。

ルール4:CLAUDE.mdとprogress.mdを必ず作る。
これがあれば、セッションが切れても次の会話で「どこまで進んだか」をAIに伝えられる。

ルール5:本番に触れる前に必ずdry-runを実施する。
dry-runとは「実際には送らない・投稿しない・課金しない」状態でテストすることである。これを省略しない。


参考:既存対策ファイルとの対応関係

本ドキュメントの章 参照した既存ファイル
層A・B・Cの対策 research_failure_risk_mitigation_report.md
Codex/Opusレビュー enhanced_development_failure_risk_loop_report.md
RYGゲート enhanced_development_failure_risk_loop_report.md
テンプレート体系 review_test_reresearch_loop_templates_complete.md
コンテキスト枯渇(新規追加) Anthropic公式資料(長時間エージェント設計)
コスト管理(新規追加) 本診断で新規作成
完了定義チェックリスト(新規追加) 本診断で新規作成
月次運用チェック(新規追加) SRE Google Workbook(カナリアリリース)

↑ トップへ戻る