「生成AIのアカウントは全社員に配った。研修もやった。それでも業績の数字はびくともしない」——いま、多くの経営の現場でこうした声を聞きます。アカウントの数も、プロンプト研修の回数も増えた。けれど損益計算書は静かなまま。これは特定の会社の努力不足ではなく、導入の進め方に共通する構造の問題です。
この記事では、まず「成果が出ない」という現象を公開された調査データで確認し、その原因がどこにあるのかを整理します。そのうえで、原因の見立てとして「意味の層」という考え方を提示します。最初にお断りしておくと、本文では**「調査が示している事実」と「それをどう読むかという解釈」を、はっきり分けて書きます**。両者を混ぜないことが、生成AIの議論で最も大事な作法だと考えるからです。
調査が示す事実——「約95%が成果に至っていない」
MIT(マサチューセッツ工科大学)の NANDA プロジェクトが2025年7月に公表した調査報告書「The GenAI Divide」は、企業の生成AI導入の現在地をこう示しました。世界の企業は生成AIに多額を投じたにもかかわらず、測定可能な損益(P&L)効果を得られていない組織が約95%にのぼる(裏返せば、効果に到達したのは約5%)——大きな価値を引き出せているのは、業務に統合された一部の取り組みだけだ、というものです。この調査は、公開済みのAI導入事例300件超のレビューに、企業幹部への構造化インタビューと上級リーダー対象のアンケートを加えたものです。
ここは慎重に扱う必要があります。この「約95%」という数字は衝撃的ですが、その意味は「成果」をどう定義したかに依存します。また、同じ調査でもサンプル数の記述が報道系統によって食い違う、という指摘もあります。ですから本記事は、この数字を「生成AIは無駄だ」という結論の根拠としては使いません。あくまで、データ整備と業務への統合を欠いた導入は成果に至りにくい、という警鐘として受け取ります。実際、別の独立した調査(BCG・McKinsey 等)も、角度は違えど「触れている企業は9割近いが、実際に利益へ効いている企業はごく一部」という同じ絵を描いています。
数字を引くときの本記事の構えも先に示しておきます。出典と時点を必ず添える、定義の違う数字を横並びで比較しない、食い違いが残るものは併記する——この3つです。
原因は技術ではない——調査の診断は「learning(学習)」
では、なぜ大多数が成果に至らないのか。原因として真っ先に疑われるのは、モデルの性能・規制・人材でしょう。ところが先の調査は、その三つをいずれも主因ではないと退け、核心を「learning(学習)」だと述べています。報告書の原文はこう断じます。
"The core barrier to scaling is not infrastructure, regulation, or talent. It is learning."(スケールを阻む核心的な障壁は、インフラでも規制でも人材でもない。学習である) MIT NANDA「The GenAI Divide: State of AI in Business 2025」(2025年7月)
ここでいう「学習」は、従業員向けのAIリテラシー研修のことではありません。組織の側がAIに自社の文脈を学習させ、業務に統合する能力を指します。汎用の生成AIは、使う本人が文脈を頭の中に持っている個人作業では便利に働きます。しかし企業の基幹業務では、文脈は個人ではなく組織に分散しており、答えの正しさは社内の文書と照合しないと判定できません。汎用ツールには、組織の手順を覚え、変化に追従し、フィードバックで改善される、という統合の能力が欠けている——調査はこの欠落を指摘しています。
この欠落が現場でどう現れるか。組織固有のルールや過去の経緯(取引先ごとの例外、仕様書の改訂履歴、過去に却下された案とその理由)を参照できないAIは、同じ誤りを毎回同じ自信で繰り返します。やがて業務部門はAIへの信頼を失い、使われなくなり、改善のフィードバックも止まる——放置すると悪化していく循環です。
調査からはもう一点、実務に効く事実が読み取れます。社内だけでゼロから作った内製プロジェクトが本番に至る割合より、外部の知見と組んで進めたプロジェクトのほうが本番移行率が高く、また「広く浅く」配るより「特定の高価値業務に絞り込む」アプローチのほうが成功率が高い、という傾向です。限られた予算で内製化を始める会社にとって、これはそのまま戦略の骨格になります。
ここからは「本記事の解釈」——欠けているのは「意味の層」ではないか
ここまでが調査の示す事実です。ここから先は、それをどう読むかという解釈であり、調査自身が述べていることではない、と明確に区別します。
本記事(および出典の書籍)の見立てはこうです。AIが参照すべき「意味の層」が組織に無いこと——それが「学習できない」状態の正体ではないか。 念のため繰り返すと、これは私たちの読み替えであって、MIT NANDA が「意味の層の不在」と言っているわけではありません。同調査が指摘したのは、あくまで学習・記憶・業務統合の欠如です。私たちはそこに一歩踏み込み、「自社の知識が、そもそもAIに渡せる形になっていないからではないか」と読んでいます。請求ルールの例外はベテランの頭の中、仕様書の最新版は担当者しか知らないフォルダ、過去の判断理由はメールの海——この状態では、AIに参照すべき土台がありません。
ここでいう「意味の層」とは、組織に散らばる文書や暗黙知を、AIが正しく解釈できるメタデータ・版管理・関係性を備えた共有の参照基盤に変えたものを指します。たとえるなら組織の「図書館」です。本(文書)が大量にあることと、目録が整い・最新版と旧版が区別され・司書が「その質問ならこの棚」と案内できることは、まったく別の状態です。多くの組織は本は持っているが、目録と版管理と案内——つまり参照可能性——を持っていません。
この見立てに立つと、「ボットをいくら量産しても成果が出ない」理由は単純になります。ボットは意味の層の消費者にすぎず、供給側の土台を作らずに消費者だけ増やせば、すべてのボットが同じ貧しい文脈を参照して同じ壁にぶつかる。逆に土台さえ整えば、一つの基盤を多数の用途が共有できます。配るものを「アカウント」から「参照できる意味」へ変える——これが「全社員が触れる」から「基幹業務で効く」への転換です。
なお、この「learning gap = 意味の層の不在」という接続は、現時点では状況証拠に支えられた仮説であり、独立した実証で直接検証されたものではありません。断定ではなく、検証可能な見立てとして提示します。
用語の注意——「意味の層」はデータ分析の「セマンティックレイヤー」と別物
「意味の層」と言うと、データ分析の世界で使われる「セマンティックレイヤー」を思い浮かべる方がいるはずです。ここは混同を避けたいので、はっきり区別します。出典の書籍は、自らの立場をこう宣言しています。
本書でいう「意味の層」は、BI分野のsemantic layer(売上などの指標定義をSQLにコンパイルする、構造化データの決定論的な層)ではない。本書の「意味の層」は、組織に散在する「意味」――仕様書・暗黙知・用語・関係――をAIが参照できる形に構造化した土台を指す、より広い概念である。semantic layerやRAGは、この意味の層を支える個別技術として包含される。 『生成AIの内製化』第1章
ポイントは、「意味の層」を semantic layer や RAG とイコール(=)で結ばないことです。使うのは「包含する」「土台となる」という関係の言葉です。等号で結んだ瞬間に、1991年から続くBIの文脈と、近年のLLMの文脈が混ざり、どちらの専門家から見ても不正確になります。比喩としての「意味の層」で経営や現場に投資の意味を伝え、用語の定義で専門家への正確さを担保する——この二段構えが要点です。
まとめ——次に整えるべきは「窓口」でなく「土台」
最後に、事実と解釈を分けたまま要点を3つに絞ります。
- 【事実】 生成AI導入の大多数(約95%)は測定可能な損益効果に至っておらず、複数の独立調査がこれを支持している。原因は技術ではなく、AIが組織の文脈に統合されないこと(learning)だと調査は診断する。
- 【本記事の解釈】 その「統合できなさ」の正体を、私たちは「AIが参照すべき意味の層の不在」と読み替える(これは再解釈であり、調査自身の主張ではない)。
- 【用語】 ここでいう「意味の層」はBIのセマンティックレイヤーとは別物で、RAG等の個別技術を包含する上位の比喩として使う。
生成AIで成果を出す側に回るために最初に問うべきは、「どんなボットを作るか」ではなく「AIが参照できる土台が自社にあるか」です。窓口を増やす前に、土台を整える——内製化の出発点はそこにあります。