Dibell

RAGには4段階ある——規制業界の現実解は「第2段階を全社+第3段階を部分適用」

「RAG(検索拡張生成)を入れたのに、精度が頭打ち」「GraphRAG や OG-RAG という新しい言葉を聞くが、うちも入れるべきか」——生成AIの社内活用が一歩進んだ会社で、よく出る問いです。結論を先に言えば、検索技術には段階があり、自社の業務に必要な段階は流行ではなく業務の要件で決まります。

この記事では、AIが社内文書を参照する検索技術を4段階で整理し、規制業界・製造業にとっての現実的な落としどころを示します。なお本記事は、特定製品の優劣ではなく「段階の考え方」を扱います。

検索技術の4段階

AIに社内文書を参照させる仕組み(RAG)は、ひとくくりにできません。深さで4段階に分けて考えると、自社がどこにいて次に何が要るかが見えます。

  • 第1段階:Vector RAG——文書をベクトル化し「意味の近さ」で検索する。実装は速く、それらしい回答もすぐ返る。ただし文書の新旧も、読み手の権限も、文書同士の関係も知らない。生成AIが「静かに失敗する」場面の多くは、この素の段階の姿です。
  • 第2段階:メタデータ付きRAG——検索の前に「版・部門・有効期限・機密区分」で絞り込む。最新版だけ・この区分にアクセスできる人にだけ、という制約が効く。派手さはないが、「業務に使ってよい検索」と「デモ」を分けるのはこの段階です。
  • 第3段階:GraphRAGLazyGraphRAG——文書中の実体(製品・部品・規格条項など)とその関係を索引化し、「関係を辿る」問いに答える。「この変更はどこに波及するか」型の問いが守備範囲。索引構築のコストが課題でしたが、Lazy型で大きく下がりつつあります。
  • 第4段階:OG-RAG(オントロジー接地)——業界の概念体系やルールそのものにAIの回答を結びつける方式。論理的には最も強い一方、その体系を作って保守し続ける組織側の負荷が非常に大きい。

規制業界・製造業の現実解

ここからは本記事(書籍)の見立て・推奨です。各調査が「この構成にせよ」と言っているわけではない、という線を引いたうえで示します。

規制業界・製造業の現実解は、第2段階(メタデータ付きRAG)を全社の基盤として確立し、関係推論が効く高価値領域——たとえば製品横断の整合チェックや改版影響の追跡——に限って第3段階を部分適用するハイブリッド構成です。そして第4段階(OG-RAG)は時期尚早と位置づけます。

理由は段階ごとの費用対効果にあります。第2段階は、検索エンジンの入れ替えではなく文書側の整備(メタデータ付与・版管理)が主工程で、規制産業で「使ってよい検索」を成立させる最低条件=衛生要因です。第3段階は導入が重く、価値が出るのは「関係を辿る問い」が業務のボトルネックになっている領域に限られます。第4段階は、技術というより「概念体系を維持し続ける組織体制」の問題で、事業会社の全社規模での運用事例は現時点で確認しづらいのが実情です。

誠実に数字を扱う——「ハルシネーション40%減」とは言わない

新技術の効果は、出典の表現を正確になぞることが大事です。本記事はここでも、引用元が言っていないことを言ったことにしません。

たとえば OG-RAG について、原論文が報告しているのは「応答の正確性が約40%向上、事実の再現率が約55%向上」といった結果です。これを「ハルシネーションが40%減る」と言い換える表現を見かけますが、それは不正確な言い換えなので本記事では使いません。GraphRAG の優位を示す「勝率」の数値も、AIに勝ち負けを判定させるやり方には偏りがあるとの指摘があるため、断定せず参考値として扱います。メタデータ絞り込みが精度を上げるという報告(内容のみの検索を上回る)も、実験設定に依存するため「絶対値」ではなく「方向の根拠」として引きます。なお、ここで挙げた OG-RAG(arXiv:2412.15235・v1)と GraphRAG(arXiv:2404.16130・v2)はいずれも査読前のプレプリントであり、数値は確定値でなく方向の根拠として扱う前提です。

新しい段階に登るかどうかは、こうした宣伝文句ではなく、自社のKPIで決めます。

新しい段階に登る判断は流行ではなくKPIで行う 『生成AIの内製化』第2章

具体的には、第2段階の正答率が頭打ちになり、誤答の原因分析に「関係を辿れなかった」型が目立ってきたときが、第3段階を検討する合図です。逆に言えば、そのシグナルが出る前に GraphRAG や OG-RAG へ飛びつくのは、たいてい早すぎます。

まとめ——事実・推奨・判断基準

  1. 【整理】 AIの社内文書検索は4段階(Vector RAG → メタデータ付き → GraphRAG → OG-RAG)。深いほど強いが、運用負荷とコストも上がる。
  2. 【本記事の推奨】 規制業界・製造業は「第2段階を全社基盤・第3段階を高価値領域に部分適用・第4段階は時期尚早」。これは本記事側の見立てで、調査の断定ではない。
  3. 【判断基準】 段階を上げるのは流行ではなくKPIで。第2段階の正答率が頭打ち+「関係を辿れない」誤答が増えたら第3段階を検討する。

検索技術は、強い段階を選ぶゲームではなく、自社の業務が要求する段階を見極めるゲームです。多くの会社にとって、まず効くのは第2段階——つまり前回の記事で触れた「意味の層」を、版管理とメタデータで支えることです。

まずは、お話を聞かせてください

AIエージェント設計、業務の自動化、AIプロダクト開発を中心に、DX全般を伴走支援します。何から始めればいいか分からない、その段階からお気軽にご相談ください。