Dibell

AIに使えるデータはどれか——社内データの「AI-Ready度」診断と棚卸しの始め方

「仕様書はどこにありますか」「設計部のサーバーと、品証部の共有フォルダと……個人のPCにもあるはずです」「最新版はどれですか」「……担当に聞かないと分かりません」。生成AI導入の相談で最初に交わされる会話は、驚くほど似ています。この会話が成り立つ会社では、AIにどの文書を渡しても正答は期待できません。原因はAIの能力ではなく、「どれが正しい文書か」が社内で一意に決まっていないこと。**正本(せいほん)**が曖昧なら、AIだろうと人だろうと、同じように探し迷います。

前回までで「成果に至らない約9割」「自社の現在地(成熟度)」を見ました。今回はその次の一手——**いま組織のどこに、どんな知識が、どんな状態で眠っているかを測る「棚卸し」**です。建築でいえば地質調査と材料の検品にあたります。ここを飛ばして着工した現場が、後で「精度の壁」にぶつかります。

まず測る理由——軽くて、効いて、外注できない

棚卸しから始める理由は3つあります。

ひとつ目は、失敗の主因がここにあること。前回触れたとおり、谷を越えられない要因の筆頭はデータ基盤の成熟度でした。地質調査を省いた建築が傾くように、データの現状を知らない導入は、モデルの性能と無関係に沈みます。

ふたつ目は、軽いこと。対象を1〜2部門に絞れば、聞き取り数回と突き合わせで2週間あれば一巡できます。特別なツールも予算も要りません。重いのは診断ではなく、診断を飛ばした場合の手戻りのほうです。

3つ目は、外注してはいけない仕事だということ。どれが正しくてどれが古いかを見分けるのは、業務を知る人にしかできない判断です。外部パートナーは進め方の型を持ち込めますが、答えを持っているのは常に現場です。診断を丸ごと外注すると、結果の意味を解釈する力まで外に置いてくることになります。

手法1:データ所在のヒアリング(知識地図を作る)

1つ目は、部門に聞き取りをして**社内の「知識の地図」**を描く作業です。網羅は狙いません。対象の業務について「何が・どこに・どんな状態であるか」を一覧にできれば十分です。質問は、おおむね次の7点に集約できます。

  1. その業務で毎日見る文書は何で、ざっと何件あるか
  2. その置き場所はどこか(共有サーバー/クラウド/各自のPC/紙)
  3. 正と旧をどう見分けているか(最新版の判別方法)
  4. 機密のレベル分けはあるか(段階数・明文化の有無)
  5. 各文書の更新責任者が決まっているか
  6. どんなとき・どれくらいの頻度で更新されるか
  7. 探すのにいちばん手間取る文書や質問は何か

ここでの生命線は、自己申告を鵜呑みにしないことです。

回答ではなく画面を見て記録するのが、この手法の生命線だ。 『生成AIの内製化』第3章

「版管理はできています」という回答の半分は、フォルダに「最新」「final」「final2」が並ぶ現実とセットです。だから設問3では「いま、この文書の最新版を開いてみてください」と頼みます。そこに辿り着くまでの手順と時間こそ、どんな口頭の説明よりも確かな診断データです。なお設問7の「困っている質問」は、後で精度を測る評価用の問題集の種にもなります——現場が探すのに困っている質問こそ、AIに最初に答えさせるべき質問だからです。

手法2:AI-Ready度を6観点で採点する

地図ができたら、文書群ごとに「AIでどれだけ使えるか」を採点します。観点は6つ、各0〜2点で見ます。

  1. 電子化・可読性(機械が読めるテキストか)
  2. 正本の一意性(「これが正」と言える1点が定まるか)
  3. 版管理(旧版と現行版を機械的に区別できるか)
  4. 機密区分(区分が定義され文書に紐づくか)
  5. 構造化度(セル結合や擬似表でなく、見出し・表が規律的か)
  6. 鮮度・オーナー(更新責任と周期が機能しているか)

合計は0〜12点。9点以上なら即着手可、5〜8点は整備とセットで着手、4点以下はAI以前の文書管理が主戦場、という目安です。ただし合計点より最低点を見ます。木桶の水位が一番低い板で決まるのと同じで、平均が良くても版管理(観点3)が0点なら、規制業界ではその文書群は着手不可と判断すべきです。

採点で大事なのは、点の低さを部門の責任にしないこと。診断の目的は査定ではなく、次工程(データ整備)の工数見積もりです。「観点1が0点だから、この文書群はテキスト化の工数が要る」——低い点は、やるべき作業の所在を教えてくれる情報にすぎません。これを冒頭で宣言しておくと、回答の正直さが目に見えて変わります。査定に見えた瞬間、現場は点を取り繕い、地図は嘘になります。

最初の1領域は「ペイン × AI-Ready」の右上で選ぶ

診断の目的は、点数表を作ることではなく初戦を選ぶことです。原則は一貫しています——ペインが大きく、かつデータがAI-Readyに近い領域から、1つだけ選ぶ

縦軸にペイン、横軸にAI-Ready度を取ると判断は明快です。右上(ペイン大×Ready高)が初戦。右下(誰も困っていない)は見送り、左上(魅力的だが整備が重い)は第2弾の本命として整備計画だけ先に立てる、左下は対象外。

ここで**ペインは感想でなく「頻度 × 時間 × 誤りコスト」**で見積もります。「その確認作業は、誰が・月に何回・1回何分やっているか」に「間違えたら何が起きるか」を掛ける。たとえば「仕様確認:30名 × 月20回 × 1回10分」なら、年1,200時間が探す行為に消えている計算です(数値は説明用の仮の例)。この見積もりは、後で効果を測るときの「導入前の数値」にもそのまま使えます。

そして、初戦は1領域に絞る。魅力的な領域が3つ並んでいても、まず1つで一巡して型を作り、横展開する。垂直特化が水平展開に勝るのは、前々回見た調査の傾向とも一致します。

まとめ——事実・本記事の整理・使い方

  1. 【事実】 着工前のデータ把握を欠いた導入は、モデルの性能と無関係につまずく(調査が示すデータ成熟度の重要性)。AI-Readyを「データ・人材・ガバナンス」で捉える枠組みも公開されている。
  2. 【本記事の整理】 そのうち「データ」を、ヒアリング7問の知識地図と6観点採点で測り、「ペイン×AI-Ready」の右上から初戦を1つ選ぶ——という手順に落とす。観点や象限の置き方は本記事側の実務的な整理です。
  3. 【使い方】 点の低さは査定でなく工数情報。現物主義(画面を見る)と「査定にしない宣言」が、正直な地図を作る。

棚卸しは、単なる準備作業ではありません。自社の知識と自分たちの関係を、初めて外から眺める作業です。ここに着手した時点で、「意味の層」づくりは実質的に動き出しています。次回は、その土台を実際に建てる工程です。

まずは、お話を聞かせてください

AIエージェント設計、業務の自動化、AIプロダクト開発を中心に、DX全般を伴走支援します。何から始めればいいか分からない、その段階からお気軽にご相談ください。