AIエージェント時代にRAGが不可欠な理由 – MCP連携で実現する企業データ活用

こんにちは。電通総研の業務RAGソリューションKnow Narrator Searchを使用し、AIエージェントの開発を行っている徳原です。今年になってからAIエージェントへの注目度が高まってきたことを実感します。社内でも「AIエージェント」や「MCP」という言葉が飛び交っていますね。

「RAGはもう古い!これからはAIエージェントの時代だ!!」そんな声もちらほら聞こえますが、実は、AIエージェントのビジネス活用が進むほど「RAG」がますます重要になります。

今回はできるだけわかりやすく、なぜAIエージェント時代にRAG(検索拡張生成)が不可欠なのかを解説します。この記事を読むことで、最新の生成AI活用の動向と社内データ活用のポイントがつかめるはずです。

AIエージェントとMCPの基礎知識

まず「AIエージェント」と「MCP」とは何でしょうか。これらの用語はすこし抽象的な概念で意味をとらえにくい単語かと思います。

AIエージェントとは、大規模言語モデル(LLM)がユーザーの指示に応じてツールやデータベースなどと連携し、自律的にタスクを実行するAIシステムを指します。

単なるチャットボットにとどまらず、必要に応じてWeb検索をしたり、社内のシステムにアクセスしたり、複数の指示を自律的に順序立てて実行したりできます。「エージェントAI」「エージェンティックAI」などとも呼ばれ、2023年以降、全世界で研究開発が盛んにおこなわれてきました。

一方、MCP(Model Context Protocol)は、そのAIエージェントが外部のデータやサービスに接続するための共通ルール(プロトコル・通信規格)を指します。広義的にはAPIの一種と言えますね。

MCPの仕組みを使うと、AIが様々な外部リソース(社内DB、Web、アプリのAPIなど)に統一的で安全な方法でアクセスできるようになります。2024年11月にClaudeで有名なAnthropic社が提唱して以来、OpenAIやGoogle、Microsoft、AWSといった大手企業も次々に採用を表明し、今や生成AI分野のデファクトスタンダードな規格になりつつあります。どんなAIエージェントにも同じ仕様で連携できるという意味でMCPは生成AI界のType-C規格と言われています。

2025年前半には主要IT企業がこぞってMCP対応を進めました。異なるサービス・データへの接続を単一の方式で扱える点が評価され、AIエージェント時代のインフラとしてMCPが急速に広まっています。MCPは「AIエージェントのための共通言語」のようなもので、これによってエージェントが社内外のシステムとやり取りするハードルがぐっと下がったのです。

それではなぜ、MCP対応のAIエージェントが普及するとRAGの必要性が増すのでしょうか? その答えを理解するために、RAGとは何かを次に押さえておきましょう。

RAG(検索拡張生成)とは何か?

RAGとは Retrieval-Augmented Generation の略で、日本語では「検索拡張生成」と呼ばれます。生成AIが回答を作る前に外部の情報源を検索し、その結果を参照して回答を生成する技術です。簡単に言えば、AIに「調べ物をしてから答えさせる」仕組みです。

例えば、人間に例えるなら、RAGは「とても優秀な司書さん」のような存在です。あなたが図書館の司書に「生成AIを製造業で活用した事例の載っている本はある?どんなことが書いてある?」と尋ねるとしましょう。

とても優秀な司書さん(=RAG)は館内の検索システムで「生成AI」「事例」といったキーワードから本を探し出し、その本の該当ページを読んで、「○○という本の第3章にこう書かれています…」と根拠を示しながら答えてくれるイメージです。生成AIの場合、この「本」に当たるものが社内文書やデータベース情報になります。

RAGの活用により次のようなメリットがあります。

  • リアルタイム調査: RAGではAIが質問に関連する文書やデータをリアルタイムで検索します。これによりモデルのトレーニング時点では存在しなかった新しい知識や社内限定の情報も回答に反映できます。 
  • 根拠の明示: RAGを使うと、AIの回答に出典や根拠を付けやすくなります。実際、引用付きの回答で知られる検索エンジン型AI(Bing ChatやPerplexity AIなど)は中核にRAGの技術を活用しています。AIが参照した情報源を示して、回答の信頼性や説明責任を高められます。 
  • 誤答の抑制: 外部情報を参照して、AIが自信のない領域で「幻覚(ハルシネーション)」と呼ばれるデタラメな回答をしてしまうのを防ぐ効果もあります。常に情報ソースに基づいて答えるため、いい加減な創作をしにくくなるのです。 

要するに、RAGはAIに現実世界の知識をその場で仕入れさせるための仕組みです。AIエージェントがどんなに高性能でも、学習済みの知識だけでは限界があります。

RAGがあれば「知らないことは調べてから回答する」という人間らしい振る舞いが可能になり、常に最新かつドメインに即した応答が期待できます。

では、このRAGがなぜAIエージェント時代に不可欠なのでしょうか? いよいよ本題に入ります。

なぜAIエージェント時代にRAGが必要なのか

MCP対応のAIエージェントが外部システムに接続できるようになったからといって、“RAGなしでも何でも答えてくれる”わけではありません。むしろ、その外部連携の力を十全に引き出すためにRAGが重要になるのです。ここからは、AIエージェント時代にRAGが不可欠な理由を3つのポイントで説明します。

エージェントに欠かせない業務固有の知識「コンテキスト」

ユーザーの役に立つものにするためには、AIエージェントに適切なコンテキスト(状況や知識の文脈)を与えてあげる必要があります。生成AIはITなど特定の分野の専門知識を有していますが、一般的にはその知識レベルは大学生学部レベルと言われています。

したがって実ビジネスにおいて、業界・企業に特化した専門性の高いタスクを実施させるには、コンテキストとして知識を補う必要があるのです。

企業や大学等で行われている研究開発の結果に共通している知見として、「エージェントAIで成果を出す鍵は、モデル自体の高度化以上にモデルに適切なコンテキストを与えることだ」と言われています。たとえ最先端のAIでも、企業データや業務知識、ユーザーの意図を深く理解しなければ十分な成果は上げられません。

生成AIにあなたの業務知識を補うことなく何かタスクを依頼するというのは、生成AIに目的地だけ指示して目隠させて車を運転させるようなものです。

多くの企業がエージェントAIに投資していますが、肝心のAIエージェントが自由にアクセスできるデータ基盤が整っておらず、リアルタイムデータや業務コンテキストをエージェントに提供できていないために、誤った回答(幻覚)が生じているのが実態です。要するに、現状のAIエージェントは「専門知識ゼロ」のままでは力を発揮できていないのです。

そこでRAGの出番です。RAGはAIエージェントにその業務の背景にある「専門知識」を供給する役割を担います。MCPによってAIが外部システムへアクセスできるとしても、「何をどう調べるか」を決め、必要な情報を取得してくるのはRAGです。

AIが複雑なタスクを実行する際にも、その都度関連情報を検索・取得(=RAG)しながら進行すれば、文脈を踏まえた正確な判断が可能になります。RAGはエージェントにとって「知恵の源泉」であり、エージェントが自主的に動くための燃料のようなものと言えるでしょう。

MCPとRAGは競合ではなく、お互いを補完しあう存在

ここで「MCPがあるならAPIで直接データベースにアクセスすればいいのでは? RAGと何が違うの?」という疑問が出てくるかもしれません。MCPとRAGはしばしば混同されますが、その役割は異なります。

  • MCP:AIエージェントが外部のツールに接続してタスクを実行するための包括的な枠組みです。AIエージェントはMCPの規格に従って、自律的にネット検索をする、メールを出す、業務システムを操作するといった作業をツールとして実行します。
  • RAG:AIが外部から知識を参照して回答の質を高めるための技術です。最新情報の取り込みや根拠提示による信頼性向上が得意です。いわばAIエージェントの「情報参照役」です。 

両者は競合する技術ではなく補完関係にあります。MCPがどんなに発達しても、それ自体は「情報そのもの」を生み出す機能ではありません。MCPを通じてアクセスするデータ源(情報検索のツール)としてRAGが必要なのです。逆に、RAGだけあってもエージェントがそれを考えながら適切に使用する仕組み(MCP)がなければ、AIエージェントはRAGの知識にアクセスできません。

AIエージェント時代にはMCPによるツール連携とRAGによる情報検索、この両輪が揃って初めて真価を発揮するのです。

AIエージェントはRAGで情報を取得する

では実際に、MCPにより社内情報にRAGを使ってアクセスできるAIエージェントが情報を得る場面を考えてみましょう。

ユーザーがエージェントに「先月の営業成績をまとめて」と頼んだとします。エージェントは社内のデータベースから必要な数字や内容を取ってくる必要があります。このとき考えられる手段は2つあります。

  1. 構造化データに直接アクセスする方法: エージェントが自然言語からSQLクエリを生成し、MCPサーバー経由でデータベースに実行して必要な数値を取得する方法です。例えば、外部のAIエージェントが生成したSQLをMCP接続で実行し、既存のデータベース内の最新データを取得します。
  2. 非構造データを検索(RAG)する方法: エージェントが社内の報告書やExcelファイルなどから関連する記述を検索し、その内容を読んで要約する方法です。これは典型的なRAGの流れで、エージェントはまず「先月の営業成績」に関する社内ドキュメントをMCPサーバー上の検索機能で探し出し、見つけた記述を元にレポートのまとめを生成します。この場合、事前に営業報告書類がRAG用データベースに登録されている必要があります。

多くの現実的なシナリオでは、RAGによるドキュメント検索が極めて重要になります。数値など構造化データは直接DB照会できても、説明文や知識は文章(非構造データ)という形で保管されているからです。先の例でも、売上の数字自体はSQLで取得できても、「その背景や分析結果を報告書から引用して答える」といったケースを実現するにはRAGでなければ困難です。

したがって、AIエージェントでは、MCPを通じてRAG検索を活用する場面が頻繁に生じます。

実際、現在開発されている多くのMCPサーバーにはRAG用のベクトルデータベース機能が組み込まれており、企業が信頼性の高いコンテキスト指向のAIエージェントを構築できるようになっています。このように主要なAIプラットフォームはこぞってRAGをAIエージェントの情報の保管庫として活用する動きが強まっています。

社内データ活用のためRAG環境を整備する

AIエージェントを自社で本格活用するためには、社内の情報基盤を「RAG対応」に整備しておく必要があります。 残念ながら現状では、PoC(概念実証)止まりで終わってしまう例も少なくありません。確かに、社内文書をRAGで使用するためにデータベース化する作業は簡単ではありません。

個人管理のPCやファイルサーバーにある文書ファイルをRAGで使用可能なように整備するのであれば、作業者が直接ファイルを取りに行ったほうがいいと感じる人が多いと思います。

しかし、人間はそれで適切なファイルにアクセスできるかもしれませんが、AIエージェントはRAGによって情報検索ができる状態になっていないといつまでたってもAIエージェントが作業の実施に必要なコンテキストを集めるために、自由に社内のファイルにアクセスする日は来ないのです。

現状の課題を解決し、AIエージェントを実業務へ迅速に導入するためには、AIエージェントがRAGを通じて業務固有の知識へ円滑にアクセスできる環境の構築が不可欠です。その実現には【データ統合】【検索基盤の構築】が重要な要素となります。具体的な施策として、以下を検討します。

  • データの一元化 : 部署ごとにバラバラに散らばったファイルサーバー、SharePoint、メール、クラウドストレージなどの情報を、可能な限り横断検索できるようにしましょう。必ずしも物理的に一箇所に集めなくても、クローラーや連携によって横串検索できる環境があればOKです。 
  • ベクトルデータベースの構築: 社内文書やナレッジをベクトルインデックス化(文書をベクトル埋め込みに変換して索引化)しておくと、AIが意味ベースで関連文書を探せるようになります。これがRAG環境の中核です。専門知識がなくても使える企業向けソリューション(例えば当社のKnow Narrator Searchのような製品)もあるので、社内展開しやすい形で導入を検討しましょう。 
  • 権限管理の設定: 安全に社内データを使うために、誰がどの情報にアクセスできるかを制御する仕組みを組み込みます。MCP経由でRAGを行う際にも、ユーザーの権限に応じて検索対象を限定できるようにすることが重要です。人事機密や個人情報などは適切にマスキング・除外するなど、セキュリティやコンプライアンス対策も忘れずに(弊社のKnow Narrator SearchならMSアカウントにより権限を一元管理できます)。 
  • データ更新フローの確立: 社内のデータは日々更新されます。新しい文書やデータが追加・変更されたら、RAG用データベースにも即座に反映されるような更新フローを自動化しましょう。常に最新情報が検索で引っ掛かる状態を維持し、AIエージェントが「古いデータに基づいて答えてしまった」という事態を防げます。 
  • 既存システムとの連携: 社内に既にFAQデータベースや全文検索システムがある場合、それらとAIエージェントを統合できるAPIやアダプターを用意すると良いでしょう。MCPサーバーとして機能するAPIを実装すれば、エージェントはそれを通じて既存の検索エンジンを利用できます。ゼロからすべて新構築する必要はありません。使えるものは活かした方がコスト効率も高いです(くどいようですが、弊社のKnow Narrator SearchならKN APIにより自動的にデータベースを更新するパイプラインを構築できます)。 

こうした準備を進めれば、AIエージェントが社内の「知恵袋」へ自由にアクセスできる状態を作り出せます。

言い換えれば、「社内のあらゆる情報を引き出せるAIアシスタント」を実現する土台ができると言えます。

これにより、これまで人に頼っていた情報検索や分析業務をAIエージェントが肩代わりし、社員はより創造的な仕事に専念できるようになるでしょう。

まとめ

AIエージェントとMCPが注目される今だからこそ、裏側でAIエージェントに知識を提供するRAGの重要性を忘れてはいけません。MCPがAIと外部世界をつなぐ「橋」だとすれば、RAGはその橋を渡った先でAIエージェントが適切な行動をとるための情報を提供するナビゲーションのようなものです。

AIエージェント時代において、最新の知識や社内固有の情報をAIに与えるRAGは、もはや不可欠の技術基盤となりました。

自社でAIエージェント活用を検討している皆さんは、ぜひ社内データのRAG対応準備に着手してください。それは単にAIプロジェクトを成功させるだけでなく、社内ナレッジを整理し活用するDX(デジタルトランスフォーメーション)の一環にもなります。「AIエージェント × RAG」は、これからの企業競争力を左右すると言っても過言ではありません。

AIエージェントに関する技術はまだ開発途上のところもあり、今すぐにAIエージェントの業務適用を実現できる範囲は限定的かもしれませんが、将来的にAIエージェントが情報源としてMCP経由でRAGを活用するには今のうちにRAG基盤を整備し、社内の情報を継続的に整備していく必要があります。 RAG基盤としては弊社のソリューションKnow Narrator Searchが活用可能です。ご興味がある方はぜひ資料をダウンロードいただければと思います。また、Know Narrator AgentSourcingを利用すればKnow Narrator SearchをRAG基盤としたAIエージェントの構築可能です。

最後までお読みいただきありがとうございました。AIエージェント時代のデータ活用について、少しでもヒントになれば幸いです。

執筆
AIコンサルティンググループ
徳原 光