2026.06.03

AIに使えるデータはどれか——社内データの「AI-Ready度」診断と棚卸しの始め方

「仕様書はどこにありますか」「設計部のサーバーと、品証部の共有フォルダと……個人のPCにもあるはずです」「最新版はどれですか」「……担当に聞かないと分かりません」。生成AI導入の相談で最初に交わされる会話は、驚くほど似ています。この会話が成り立つ会社では、AIにどの文書を渡しても正答は期待できません。原因はAIの能力ではなく、「どれが正しい文書か」が社内で一意に決まっていないこと。**正本（せいほん）**が曖昧なら、AIだろうと人だろうと、同じように探し迷います。

前回までで「成果に至らない約9割」「自社の現在地（成熟度）」を見ました。今回はその次の一手——**いま組織のどこに、どんな知識が、どんな状態で眠っているかを測る「棚卸し」**です。建築でいえば地質調査と材料の検品にあたります。ここを飛ばして着工した現場が、後で「精度の壁」にぶつかります。

まず測る理由——軽くて、効いて、外注できない

棚卸しから始める理由は3つあります。

ひとつ目は、失敗の主因がここにあること。前回触れたとおり、谷を越えられない要因の筆頭はデータ基盤の成熟度でした。地質調査を省いた建築が傾くように、データの現状を知らない導入は、モデルの性能と無関係に沈みます。

ふたつ目は、軽いこと。対象を1〜2部門に絞れば、聞き取り数回と突き合わせで2週間あれば一巡できます。特別なツールも予算も要りません。重いのは診断ではなく、診断を飛ばした場合の手戻りのほうです。

3つ目は、外注してはいけない仕事だということ。どれが正しくてどれが古いかを見分けるのは、業務を知る人にしかできない判断です。外部パートナーは進め方の型を持ち込めますが、答えを持っているのは常に現場です。診断を丸ごと外注すると、結果の意味を解釈する力まで外に置いてくることになります。

手法1：データ所在のヒアリング（知識地図を作る）

1つ目は、部門に聞き取りをして**社内の「知識の地図」**を描く作業です。網羅は狙いません。対象の業務について「何が・どこに・どんな状態であるか」を一覧にできれば十分です。質問は、おおむね次の7点に集約できます。

その業務で毎日見る文書は何で、ざっと何件あるか
その置き場所はどこか（共有サーバー／クラウド／各自のPC／紙）
正と旧をどう見分けているか（最新版の判別方法）
機密のレベル分けはあるか（段階数・明文化の有無）
各文書の更新責任者が決まっているか
どんなとき・どれくらいの頻度で更新されるか
探すのにいちばん手間取る文書や質問は何か

ここでの生命線は、自己申告を鵜呑みにしないことです。

回答ではなく画面を見て記録するのが、この手法の生命線だ。『生成AIの内製化』第3章

「版管理はできています」という回答の半分は、フォルダに「最新」「final」「final2」が並ぶ現実とセットです。だから設問3では「いま、この文書の最新版を開いてみてください」と頼みます。そこに辿り着くまでの手順と時間こそ、どんな口頭の説明よりも確かな診断データです。なお設問7の「困っている質問」は、後で精度を測る評価用の問題集の種にもなります——現場が探すのに困っている質問こそ、AIに最初に答えさせるべき質問だからです。

手法2：AI-Ready度を6観点で採点する

地図ができたら、文書群ごとに「AIでどれだけ使えるか」を採点します。観点は6つ、各0〜2点で見ます。

電子化・可読性（機械が読めるテキストか）
正本の一意性（「これが正」と言える1点が定まるか）
版管理（旧版と現行版を機械的に区別できるか）
機密区分（区分が定義され文書に紐づくか）
構造化度（セル結合や擬似表でなく、見出し・表が規律的か）
鮮度・オーナー（更新責任と周期が機能しているか）

合計は0〜12点。9点以上なら即着手可、5〜8点は整備とセットで着手、4点以下はAI以前の文書管理が主戦場、という目安です。ただし合計点より最低点を見ます。木桶の水位が一番低い板で決まるのと同じで、平均が良くても版管理（観点3）が0点なら、規制業界ではその文書群は着手不可と判断すべきです。

採点で大事なのは、点の低さを部門の責任にしないこと。診断の目的は査定ではなく、次工程（データ整備）の工数見積もりです。「観点1が0点だから、この文書群はテキスト化の工数が要る」——低い点は、やるべき作業の所在を教えてくれる情報にすぎません。これを冒頭で宣言しておくと、回答の正直さが目に見えて変わります。査定に見えた瞬間、現場は点を取り繕い、地図は嘘になります。

最初の1領域は「ペイン × AI-Ready」の右上で選ぶ

診断の目的は、点数表を作ることではなく初戦を選ぶことです。原則は一貫しています——ペインが大きく、かつデータがAI-Readyに近い領域から、1つだけ選ぶ。

縦軸にペイン、横軸にAI-Ready度を取ると判断は明快です。右上（ペイン大×Ready高）が初戦。右下（誰も困っていない）は見送り、左上（魅力的だが整備が重い）は第2弾の本命として整備計画だけ先に立てる、左下は対象外。

ここで**ペインは感想でなく「頻度 × 時間 × 誤りコスト」**で見積もります。「その確認作業は、誰が・月に何回・1回何分やっているか」に「間違えたら何が起きるか」を掛ける。たとえば「仕様確認：30名 × 月20回 × 1回10分」なら、年1,200時間が探す行為に消えている計算です（数値は説明用の仮の例）。この見積もりは、後で効果を測るときの「導入前の数値」にもそのまま使えます。

そして、初戦は1領域に絞る。魅力的な領域が3つ並んでいても、まず1つで一巡して型を作り、横展開する。垂直特化が水平展開に勝るのは、前々回見た調査の傾向とも一致します。

まとめ——事実・本記事の整理・使い方

【事実】 着工前のデータ把握を欠いた導入は、モデルの性能と無関係につまずく（調査が示すデータ成熟度の重要性）。AI-Readyを「データ・人材・ガバナンス」で捉える枠組みも公開されている。
【本記事の整理】 そのうち「データ」を、ヒアリング7問の知識地図と6観点採点で測り、「ペイン×AI-Ready」の右上から初戦を1つ選ぶ——という手順に落とす。観点や象限の置き方は本記事側の実務的な整理です。
【使い方】 点の低さは査定でなく工数情報。現物主義（画面を見る）と「査定にしない宣言」が、正直な地図を作る。

棚卸しは、単なる準備作業ではありません。自社の知識と自分たちの関係を、初めて外から眺める作業です。ここに着手した時点で、「意味の層」づくりは実質的に動き出しています。次回は、その土台を実際に建てる工程です。

知見一覧へ戻る

まずは、お話を聞かせてください

AIエージェント設計、業務の自動化、AIプロダクト開発を中心に、DX全般を伴走支援します。何から始めればいいか分からない、その段階からお気軽にご相談ください。