レビュー・テスト・再リサーチループ 実プロジェクト導入ガイド
作成者: Manus AI
対象: 非エンジニア起点の新規開発、AI支援開発、既存プロジェクト改善、要件定義・仕様策定・ハーネス設計・テスト計画を含むプロジェクト
1. 導入ガイドの目的
この導入ガイドは、既に作成済みのテンプレート群を、実際のプロジェクトで迷わず使えるようにするための実行手順書である。目的は、非エンジニアが「やりたいこと」を伝えるだけで、調査、要件定義、仕様策定、技術要件、ハーネス設計、テスト計画、Codexレビュー、Opusレビュー、再リサーチ、再提案までを一貫して進められる状態を作ることである。
この仕組みでは、レビューを単なる指摘で終わらせない。テストを単なる動作確認で終わらせない。再リサーチを単なる調査メモで終わらせない。すべての発見事項を、要件、仕様、技術要件、ハーネス、テスト、タスク、ゲート判定へ戻すことで、開発破綻リスクを継続的に下げる。
導入の本質は、作業管理を増やすことではなく、素人が見抜けないリスクを構造的に発見し、設計へ戻すことである。
2. 導入前に決めること
導入前に、プロジェクトの規模、対象範囲、適用レベル、関係者、利用ツールを決める。ここを曖昧にすると、テンプレートが「書類」になり、実務の意思決定に使われなくなる。
| 決定項目 | 推奨する決め方 | 悪い例 | 良い例 |
|---|---|---|---|
| 適用対象 | 最初は1機能、1画面、1ワークフローに限定する | プロジェクト全体に一気に適用する | まず「ユーザー登録機能」だけに適用する |
| 運用周期 | 日次、週次、ゲート時の3層に分ける | 気づいた時だけ確認する | 日次5分、週次30分、ゲート判定1時間 |
| 管理単位 | 要件ID、タスクID、テストID、リスクIDで接続する | タスク名だけで管理する | R-001、T-006、TC-003、RK-002を紐づける |
| 判定方式 | Green / Yellow / Redを必ず使う | 感覚で「大丈夫」と判断する | Yellowなら条件、期限、担当を付ける |
| AIレビュー | CodexとOpusの役割を分ける | 1つのAIに全部聞く | Codexは実装・CI、Opusは採否・運用を見る |
3. 導入ステージ全体像
導入は、準備、初期適用、レビュー運用、再リサーチ運用、定着化の5段階で進める。最初から全テンプレートを完璧に使う必要はないが、要件、根拠、テスト、リスク、ゲート判定は最初から接続する。
| ステージ | 目的 | 使用テンプレート | 完了条件 | 失敗しやすい点 |
|---|---|---|---|---|
| Stage 0 準備 | 対象、役割、ツール、ID体系を決める | ロール定義、RACI、全体フェーズ表 | 誰が何を判断するか決まっている | 担当だけ決めて判断権限を決めない |
| Stage 1 初期整理 | 素人の希望をIntentと仮説へ変換する | Intent Sheet、初期ヒアリング、要望Backlog | 目的、対象者、成功条件、不明点が分離されている | 希望をそのまま実装タスクにする |
| Stage 2 根拠化 | 公式、論文、規約、事例、失敗例を集める | Evidence Matrix、Research Log | Must要件に根拠IDが付いている | ブログや推測だけで要件化する |
| Stage 3 設計・検証化 | 要件、仕様、ハーネス、テストへ落とす | Requirement Register、Harness Plan、Test Plan | Must要件がテストIDへ接続されている | テスト不能な要件を残す |
| Stage 4 レビュー | Codex/Opusで破綻を検出する | Codex Review、Opus Review、Gate Log | 指摘が重大度、原因、対応へ分類されている | レビュー指摘を修正依頼だけで閉じる |
| Stage 5 再リサーチ・再提案 | 発見事項を調査し、設計へ戻す | Re-Research Log、Re-Proposal、Change Log | 変更影響が要件・仕様・テストへ反映されている | 調査結果を文書へ戻さない |
4. 初回導入の最小セット
初回導入では、すべてのテンプレートを同時に運用しようとしない。最低限、以下の7種類を使えば、ループの骨格は成立する。
| 優先度 | テンプレート | 使うタイミング | 必須理由 |
|---|---|---|---|
| 1 | Intent Sheet | 初回ヒアリング直後 | 素人の希望を目的、対象、成功条件へ変換するため |
| 2 | Evidence Matrix | 要件化前 | 根拠のないMust要件を防ぐため |
| 3 | Requirement Register | 要件定義時 | 要件、優先度、根拠、受入基準を接続するため |
| 4 | Test Traceability Matrix | テスト計画時 | Must要件とテストIDを接続するため |
| 5 | Harness Plan | 実装前 | 本番破壊、不可逆操作、権限事故を防ぐため |
| 6 | Gate Log | 各フェーズ終了時 | Green / Yellow / Redの判断を記録するため |
| 7 | Re-Research Log | レビュー・テスト後 | 不明点やリスクを再調査へ戻すため |
5. 具体的な導入手順
Step 1. プロジェクトの対象範囲を1つに絞る
最初に、ループを適用する対象を限定する。対象は「プロジェクト全体」ではなく、「1つの機能」「1つの業務フロー」「1つのリリース単位」にする。例えば、ECサイト全体ではなく、「会員登録からメール認証まで」に限定する。
| 記入項目 | 記入例 |
|---|---|
| 対象プロジェクト | Kindle漫画管理支援アプリ |
| 初回適用範囲 | 漫画ファイルのアップロード、メタデータ抽出、一覧表示まで |
| 今回は扱わない範囲 | 決済、公開配布、外部ストア連携、自動投稿 |
| 初回ループ期間 | 2週間 |
| 成功条件 | 破壊的操作なしに、サンプルデータで主要ワークフローを検証できる |
Step 2. ID体系を決める
進捗管理とレビューを成功させるには、すべての要素をIDで接続する必要がある。IDがないと、レビュー指摘がどの要件に関係するのか、テストが何を検証しているのか、再リサーチ結果をどこへ戻すべきかが分からなくなる。
| ID種別 | 形式 | 例 | 用途 |
|---|---|---|---|
| 要件ID | R-XXX | R-001 | 実現したい機能・条件 |
| 根拠ID | E-XXX | E-001 | 公式情報、論文、規約、事例 |
| タスクID | T-XXX | T-006 | 実作業、調査、設計、レビュー |
| テストID | TC-XXX | TC-003 | 検証ケース |
| リスクID | RK-XXX | RK-002 | 破綻・事故・運用リスク |
| レビューID | CR-XXX / OR-XXX | CR-001 | Codex / Opusレビュー |
| 再リサーチID | RR-XXX | RR-004 | 未解決論点の再調査 |
| 再提案ID | RP-XXX | RP-002 | 仕様・要件・設計への戻し案 |
Step 3. ロールを割り当てる
小規模プロジェクトでは1人が複数ロールを兼任してよい。ただし、実行者と承認者を同じにしないことが望ましい。特に、本番影響、外部API、個人情報、課金、データ削除を含む場合は、最低でもProduct Owner、Tech Lead、QA/Harness Ownerの判断を分ける。
| ロール | 小規模時の兼任例 | 最低限の責任 |
|---|---|---|
| Product Owner | 依頼者または企画者 | 目的、優先度、受入判断を決める |
| Research Lead | AIまたは調査担当 | 根拠、規約、事例、失敗例を集める |
| Tech Lead | 実装担当 | 技術方式、制約、実現性を判断する |
| Harness Owner | Tech Lead兼任可 | dry-run、sandbox、rollbackを設計する |
| QA Lead | Product Ownerと分離推奨 | テスト可能性、受入基準、品質ゲートを見る |
| Codex Reviewer | 実装レビューAIまたは開発者 | コード、CI、テスト、差分を見る |
| Opus Reviewer | 要件レビューAIまたは上位レビュー担当 | 採否、運用、事業、規約リスクを見る |
Step 4. Intent Sheetを作る
素人の要望は、そのまま要件にしない。まず、目的、対象者、成功条件、不明点、制約、やらないことへ分解する。ここで重要なのは、ユーザーが言ったことを否定せず、実装可能な仮説へ翻訳することである。
| 項目 | 記入例 |
|---|---|
| 原文の要望 | 漫画ファイルを入れるだけでKindle用に整理したい |
| 本来目的 | 手作業のファイル整理とメタデータ入力を減らしたい |
| 対象ユーザー | 技術に詳しくない個人クリエイター |
| 成功条件 | サンプル10件をアップロードし、一覧表示とメタデータ修正ができる |
| 不明点 | Kindle形式への変換が必要か、単なる管理かが未確定 |
| 制約 | 本番データを消さない。外部公開は初期範囲外 |
| 初期判定 | Yellow。目的は明確だが、変換要件と権利・形式要件の確認が必要 |
Step 5. 強化リサーチを行う
リサーチでは、単に便利そうな情報を集めるのではなく、要件化に使える根拠を集める。一次情報、公式ドキュメント、規約、論文、コミュニティ事例、失敗事例を区別する。
| 調査対象 | 確認すること | 成果物 |
|---|---|---|
| 公式ドキュメント | API仕様、制限、推奨構成、禁止事項 | Evidence Matrix |
| 規約・ポリシー | 利用条件、データ利用、公開可否、商用利用 | Risk Register |
| 論文・技術記事 | 技術方式、評価方法、既知の限界 | Technical Notes |
| コミュニティ事例 | 実務上の落とし穴、エラー、運用負荷 | Failure Pattern List |
| 競合・類似サービス | UX、機能範囲、一般的な期待値 | Product Comparison |
Step 6. 要件と受入基準へ変換する
リサーチが終わったら、希望を要件IDへ変換する。各要件には、根拠ID、優先度、受入基準、テストID、リスクIDを接続する。根拠が弱いものはMustにしない。
| 要件ID | 要件 | 優先度 | 根拠ID | 受入基準 | テストID | RYG |
|---|---|---|---|---|---|---|
| R-001 | ユーザーは複数の漫画ファイルをアップロードできる | Must | E-001 | 10件のサンプルファイルを失敗なく登録できる | TC-001 | Yellow |
| R-002 | メタデータを自動抽出し、手動修正できる | Must | E-002 | タイトル、巻数、作者名を編集できる | TC-002 | Yellow |
| R-003 | 本番データへ影響しない検証環境で試せる | Must | E-003 | sandboxでアップロード、削除、復元を検証できる | TC-003 | Red |
Step 7. ハーネス設計を先に行う
実装前に、壊れないための実行環境を定義する。特に、ファイル削除、DB更新、外部API送信、メール送信、課金、公開投稿などの破壊的操作がある場合は、dry-run、sandbox、rollback、権限制御、監査ログを必須にする。
| ハーネス項目 | 最低条件 | Red条件 |
|---|---|---|
| sandbox | 本番データと分離された検証環境がある | 本番データでしか試せない |
| dry-run | 実行前に影響範囲を表示できる | 実行すると即変更される |
| rollback | 失敗時に戻せる手順がある | 削除や更新を戻せない |
| 権限制御 | 最小権限で実行できる | 管理者権限で全処理する |
| 監査ログ | 誰が何をいつ実行したか残る | 実行履歴が残らない |
Step 8. テスト計画を作る
テストは「動いたか」ではなく、「要件を満たし、壊れないことを示せるか」を確認する。Must要件は必ずテストIDへ接続する。接続できない要件は、曖昧すぎる可能性があるため要件へ戻す。
| テストID | 対象要件 | テスト内容 | 期待結果 | 失敗時の戻し先 |
|---|---|---|---|---|
| TC-001 | R-001 | サンプル10件をアップロードする | すべて登録され、一覧に表示される | R-001、Harness Plan |
| TC-002 | R-002 | 自動抽出後に手動修正する | 修正内容が保存され、再表示される | R-002、Spec |
| TC-003 | R-003 | sandboxで削除と復元を試す | 本番データに影響せず復元できる | Harness Plan、Rollback Plan |
Step 9. Codexレビューを実施する
Codexレビューでは、実装、テスト、CI、差分、破壊的変更、セキュリティ、エラー処理、ログを確認する。ここでは事業採否ではなく、実装破綻を見つけることに集中する。
| 観点 | 確認内容 | Red条件 |
|---|---|---|
| CI | 自動テストが安定して通るか | 主要テストが失敗したまま |
| 差分 | 想定外の変更がないか | 無関係ファイルを広範囲に変更 |
| テスト | Must要件にテストがあるか | Must要件が未検証 |
| 破壊的操作 | 削除、上書き、送信、課金が安全か | dry-runなしで実行される |
| 秘密情報 | APIキーや個人情報が漏れていないか | 秘密情報がコードに直書き |
Step 10. Opusレビューを実施する
Opusレビューでは、要件、目的適合性、ユーザー価値、運用負荷、規約、倫理、長期リスク、採否を確認する。ここではコードの細部ではなく、プロジェクトとして進めるべきか、代替案が必要かを判断する。
| 観点 | 確認内容 | Red条件 |
|---|---|---|
| 目的適合 | 本来目的と要件が一致しているか | 作っているものが目的からズレている |
| 根拠 | Must要件に十分な根拠があるか | 推測だけで重要機能を決めている |
| 運用 | 非エンジニアが運用できるか | 継続運用が専門家依存になる |
| 規約 | 外部サービス規約に反しないか | 規約違反の疑いが強い |
| 代替案 | より安全な方法があるか | 危険な方式に固執している |
Step 11. ゲート判定を行う
各フェーズの最後に、Green / Yellow / Redを判定する。Yellowは「条件付きで進める」、Redは「止める」である。YellowとRedには必ず担当、期限、次アクションを付ける。
| 判定 | 意味 | 許可すること | 禁止すること |
|---|---|---|---|
| Green | 次へ進める | 次フェーズ、限定リリース、通常検証 | 未記録の前提で進むこと |
| Yellow | 条件付きで進める | sandbox、PoC、追加調査、限定検証 | 本番投入、不可逆操作 |
| Red | 止める | 再リサーチ、設計変更、スコープ縮小 | 実装継続、本番接続、ユーザー影響操作 |
Step 12. 再リサーチを起票する
レビューやテストで原因不明、根拠不足、外部仕様不明、運用リスク不明が見つかった場合は、修正だけで閉じずに再リサーチへ回す。
| 起票条件 | 例 | 戻し先 |
|---|---|---|
| 根拠不足 | Must要件の公式根拠がない | Evidence Matrix |
| 原因不明 | CIが不安定だが実装原因か外部API制限か不明 | Re-Research Log |
| 規約不明 | 外部サービス利用が許可されるか不明 | Risk Register |
| 運用不安 | 非エンジニアが手順を実行できない | Opus Review、Re-Proposal |
| テスト不能 | 受入基準が曖昧でテスト化できない | Requirement Register |
Step 13. 再提案へ戻す
再リサーチの結果は、必ず要件、仕様、技術要件、ハーネス、テスト、タスク、ゲート判定へ反映する。反映しない調査は、プロジェクトを安全にしない。
| 再リサーチ結果 | 反映先 | 例 |
|---|---|---|
| 外部API制限が厳しい | 技術要件、テスト、ハーネス | 同期処理を非同期キューへ変更 |
| 規約リスクがある | 要件、リリース計画 | 初期リリースから対象機能を除外 |
| rollbackが不十分 | ハーネス、運用設計 | 復旧手順とログ保存を追加 |
| 要件が曖昧 | Requirement Register | 受入基準を数値化・具体化 |
6. 30日導入ロードマップ
実プロジェクトで定着させるには、30日で最小運用から通常運用へ移行するのが現実的である。
| 期間 | 目標 | 実施内容 | 成果物 |
|---|---|---|---|
| Day 1-3 | 対象範囲と役割を決める | 適用対象、ロール、ID体系、管理ツールを決定 | Project Setup Sheet |
| Day 4-7 | Intentと根拠を作る | 初期ヒアリング、公式情報、規約、失敗例調査 | Intent Sheet、Evidence Matrix |
| Day 8-12 | 要件とテストへ落とす | Requirement Register、Acceptance Criteria、Test Plan作成 | 要件ID台帳、テスト接続表 |
| Day 13-17 | ハーネスを設計する | sandbox、dry-run、rollback、ログ、権限を設計 | Harness Plan |
| Day 18-22 | 実装・レビューを行う | Codexレビュー、Opusレビュー、CI確認 | Review Reports |
| Day 23-26 | 再リサーチする | Yellow/Redを調査し、代替案を作る | Re-Research Log |
| Day 27-30 | 再提案と標準化 | 変更反映、ゲート判定、次ループ計画 | Re-Proposal、Gate Log |
7. 成功条件と失敗条件
導入が成功している状態は、ドキュメントが多い状態ではない。重要な意思決定が、根拠、要件、テスト、レビュー、リスクへ接続されている状態である。
| 成功条件 | 具体的な状態 |
|---|---|
| 非エンジニアが判断しやすい | Green / Yellow / Redと次アクションが明確である |
| 技術判断が属人化していない | 技術要件、代替案、却下理由が記録されている |
| 本番破壊リスクが下がっている | dry-run、sandbox、rollback、権限制御、ログがある |
| レビューが改善に接続している | 指摘が再リサーチIDまたは修正タスクに変換されている |
| 要件とテストが接続している | Must要件の100%にテストIDがある |
| 失敗条件 | 危険な兆候 | 対策 |
|---|---|---|
| 書類だけ増える | テンプレートはあるがゲート判定に使われない | 最小7テンプレートだけに絞る |
| Yellowが放置される | 条件付き承認が無期限になる | 担当、期限、次回判定日を必須にする |
| Redを避ける | 危険を発見してもGreenにする | Redは失敗ではなく早期発見として扱う |
| レビューが修正依頼で終わる | 同じ問題が再発する | 再リサーチ起票を必須にする |
| テストが後追いになる | 実装後にテストを考える | 要件定義時点でテストIDを作る |
8. 運用会議の推奨設計
会議体は短く、判断は明確にする。非エンジニアが参加する場では、技術詳細よりも、目的適合、リスク、RYG、次アクションを中心に話す。
| 会議 | 頻度 | 時間 | 目的 | 主な入力 | 主な出力 |
|---|---|---|---|---|---|
| 日次スタンドアップ | 毎営業日 | 5-15分 | 進捗、ブロッカー、RYG変化確認 | カンバン、タスク表 | 今日の優先タスク |
| 週次ループレビュー | 週1回 | 30-60分 | ゲート、リスク、再リサーチ確認 | Gate Log、Risk Register | 次週の再提案・修正方針 |
| Codexレビュー会 | 実装差分ごと | 30分 | 実装、CI、テスト、破壊的変更確認 | PR、テスト結果 | Codex Review Report |
| Opusレビュー会 | 要件・仕様更新ごと | 30-60分 | 採否、目的適合、運用リスク確認 | PRD、Evidence Matrix | Opus Review Report |
| ゲート判定会 | フェーズ終了時 | 30分 | Green/Yellow/Redを決める | 全成果物 | Gate Log、次アクション |
9. すぐ使える導入チェックリスト
| 分類 | チェック項目 | Yes / No |
|---|---|---|
| 対象範囲 | 初回適用範囲を1機能または1フローに限定した | |
| ロール | Product Owner、Tech Lead、QA/Harness、Researchの責任を決めた | |
| ID体系 | R、E、T、TC、RK、CR、OR、RR、RPのID規則を決めた | |
| Intent | 原文の要望、目的、成功条件、不明点を分けた | |
| Evidence | Must要件に使う根拠IDを作った | |
| Requirement | 各要件に優先度と受入基準を付けた | |
| Test | Must要件をテストIDへ接続した | |
| Harness | sandbox、dry-run、rollback、ログ、権限を確認した | |
| Review | CodexとOpusのレビュー観点を分けた | |
| Gate | 各フェーズのRYG判定と次アクションを記録した | |
| Re-Research | Yellow/Redを再リサーチへ起票するルールを決めた | |
| Re-Proposal | 調査結果を要件・仕様・テストへ戻すルールを決めた |
10. 結論
この導入ガイドに従うと、非エンジニアの漠然とした希望を、実装可能で検証可能な要件へ変換し、さらに安全に作るためのハーネス、テスト、レビュー、再リサーチ、再提案まで一体化できる。重要なのは、テンプレートを埋めること自体ではなく、発見したリスクを必ず設計と判断へ戻す運用である。
このループが機能しているプロジェクトでは、実装の速さだけで進まない。壊れる条件、失敗する条件、素人が見抜けない危険を先に発見し、調べ直し、仕様を修正し、テストで確認してから進む。これが、レビュー・テスト・再リサーチループを実プロジェクトに導入する最大の価値である。