柳谷智宣のAI ウォッチ!

生成AIを活用するならRAGも使いこなそう! ~ChatGPT&Claudeのプロジェクト、GoogleのNotebook LM、どれを選ぶ?

いまさら聞けない「RAG」とは?[後編]

 本連載「柳谷智宣のAI ウォッチ!」では、いま話題のAI(生成AI)を活用したサービスを中心に取り上げていく(基本的に1サービスにつき前後編を予定)。今回は「RAG」の基本とChatGPTやClaudeでの活用法を取り上げる。
RAGを使うと生成AIはもっとビジネスで活用できる(画像はMidjourneyで生成)

 ChatGPTやClaude、Geminiをビジネスで活用する際、AIが知らない自社独自の情報を扱ってほしいことが多い。

 もちろん毎回プロンプトに入れ込んで指示すればよいのだが、手間がかかり過ぎる。そもそも「自社の出張規定について調べたい」という従業員は、どこにその情報があるのか知らないので情報を用意することもできないだろう。

 そこでお勧めなのが「RAG(検索拡張生成、Retrieval-Augmented Generation)」を構築すること。生成AIが手持ちの情報から出力を生成できるようにする機能だ。

 今回は、RAGの基本とChatGPTやClaudeでの活用法について紹介する。

ChatGPTやClaudeにもRAG機能が用意されている

 「RAG」は、生成AIの出力プロセスに情報検索の機能を組み込んだシステムだ。通常の生成AIは学習済みの知識のみにもとづいて回答を生成するが、RAGでは質問に関連する最新情報や特定のドキュメントをリアルタイムに検索し、その結果を参照しながら回答を生成する。

 RAGを活用する最大のメリットは「生成AIが知らない独自情報や最新情報を利用できる」ことだ。例えば、生成AIは昨日発表された新製品情報や先週改定された社内規定などを知らないのは当然。RAGを導入すれば、これらの最新データから情報を取得できるため、このギャップを埋められるというわけだ。

 また、生成AIが事実と異なるハルシネーション(幻覚)を起こす確率も低減する。特定の情報源にもとづいて回答を生成するため、根拠のない創作が混入するリスクが減少するのだ。

進むRAGのビジネス活用

 実際のビジネス活用事例も増えている。

 まずは導入しやすく、大きな効果が得られやすいカスタマーサポート部門での事例が多い。これまで蓄積してきたFAQのデータベースや最新の製品マニュアル、応答マニュアルなどでRAGを構築。AIチャットボットを接続し、顧客が24時間リアルタイムに欲しい情報を得られるようにすると顧客満足度が高まる。

 人間のスタッフが対応する際も、生成AIが画面に最適な回答例を表示してくれるので、対応時間を大幅に削減できる。キーワード検索とは異なり、生成AIが質問の意図を把握してくれるため、従来のシステムでは回答できなかった細かい製品仕様や最新のトラブルシューティング情報も迅速かつ正確に提供できるようになっている。

サポートセンターではRAGの活用が進んでいる

 さらに例を挙げると、法務分野は、弁護士もしくはパラリーガルといった人材のコストが高い領域なので、RAGの導入コストをペイしやすい。大手法律事務所ではRAGを構築し、大量の判例や法令情報から欲しい情報を瞬時に抽出することにより、裁判の準備の効率化と正確性の向上を実現した。

 医療分野では、RAGを臨床判断と診断支援に活用している。最新の医療ガイドラインや類似症例データを瞬時に抽出し、複雑な症例への適切な治療方針決定に利用している病院もある。医師の情報検索効率が大幅に向上し、精度を高め、治療計画の立案を効率化している。

 ほかにも、営業支援分野では、RAGがSalesforceなどのCRMシステムと連携し、顧客情報の集約と有望リードの推奨などを行っている。過去の成約・失注データや顧客獲得機会の詳細を解析し、最適な営業アプローチ戦略を営業担当者に提示するのが特徴だ。顧客の購買履歴や問い合わせ内容、業界動向などの情報を効率的に管理し、顧客ニーズに合わせたソリューション提案が可能になり、顧客への価値提供を向上できる。

RAGを導入する際の注意点

 RAGを導入する際は、まず自社の目的や解決したい課題を明確にすることから始める。技術導入を目的とするのではなく、どのような業務の改善やユーザー体験の向上を目指すのかを整理することが重要だ。

 次に利用できるデータソースを洗い出す。社内文書や製品マニュアル、FAQデータベース、社内Wiki、顧客対応履歴など、組織内に存在するあらゆる文書資産を棚卸しする。その後、生成AIモデルと連携させ、テストしながらシステムの精度向上や範囲の拡大を図る。

 導入時の注意点としては、データソースの品質管理がもっとも重要となることを忘れないように。誤った情報や古い情報がデータベースに含まれていると、AIはそれを信頼して回答を生成してしまう。

 これはハルシネーションではなく当然の動作なので、元となるデータの精査は必須だ。また、プライバシーやデータセキュリティへの対応も欠かせない。社内の機密情報や個人情報を含むデータを扱う場合、適切なアクセス制御や暗号化、匿名化などの対策を講じておく必要がある。

 生成AIに関するシステムは一度構築して終わりになるわけではなく、継続的なメンテナンスとアップデートが必要だ。情報の鮮度を保つための更新頻度の設定や、AIモデル自体のバージョンアップなど、長期的な運用体制を整えておきたい。

お勧めはビジネスでRAGを使い始めること

 とはいえ、便利そうだといきなりベンダーに開発を発注するというのもリスキーだ。

 まず発注側にAIのスキルがなければ、何を求めているのか伝えるのさえおぼつかない。AIの素養がなければ、100%の精度を求めてプロジェクトが破綻する。何もわかってないなら、コンサルタントの言いなりになり、短期間しか役に立たないシステムを数億円で買わされる羽目になる。

 そこでお勧めなのが、まずはスモールスタートでよいので「ビジネスでRAGを使い始める」こと。とりあえず実際に触ってバリューを出すことによって、RAGには何ができて・何ができていないのかという肌感が得られる。AIスキルが身に付けば、ベンダーへ発注する際も、コストパフォーマンスがよく、サステナブルなシステムを要求できるようになるだろう。

 ちなみに、このAIスキルやAIの素養は若手が持っていればよいというわけではない。経営判断を間違えないためにも、経営層や管理職も持っておく必要があることは肝に銘じておこう。

ChatGPTとClaudeのRAG「プロジェクト」機能の使い方

 RAGの導入というと大掛かりに聞こえるが、まずはいま使っている生成AIのRAG機能を活用するところから始めてみよう。

 前回は、Googleの「NotebookLM」を紹介したので、今回はChatGPTとClaudeにおけるRAG機能の使い方を簡単に紹介しよう。

ChatGPTの「プロジェクト」機能

 ChatGPTの「プロジェクト」機能は、2024年12月に登場した。現在は有料プランで利用でき、将来は無料プランにも解放される予定だ。

 使用したいときは、画面左側の「GPTs」の下、「履歴」の上に「プロジェクト」という項目があるので[+]をクリック。プロジェクト名を付けて[プロジェクトを作成する]をクリックすると、プロジェクトが作成される。

ChatGPTの「プロジェクト」画面

 元となるデータはテキストやPDF、CSV、Excelなどに対応しており、最大20個までアップロードできる。ここでは、社内規定や業務マニュアルをアップロードし、社内の質問を受け付ける総務部門で使えるようにしてみた。

 また[指示]をクリックすると、カスタムインストラクションを設定できる。画面の回答がフランクなのは「総務担当として優しく回答して」と指示しているためだ。

宿泊規定について聞いてみた

Claudeの「プロジェクト」機能

 Claudeの「プロジェクト」機能は、2024年6月と早い時期にリリースされた。アップロードできるファイル数は無制限だが、ファイルサイズは1ファイルあたり30MB。当然、コンテンツの合計はClaudeのコンテキストウィンドウ内に収まる必要がある。

 こちらを使いたいときは、Claudeのホーム画面を開いて[プロジェクトを使用]をクリックすると、新規作成の[+]ボタンや作成済みのプロジェクトが表示される。そこで[+]をクリックしてプロジェクトを作成し、ファイルをアップロードする。

Claudeの「プロジェクト」画面

 ナレッジの一番上に表示されている[編集]をクリックすると、カスタムインストラクションを設定できる。「書類にない情報は創作せず、足りなければ、総務課の山田までLINE WORKSで質問するように表示してください」と書いておけば、回答できないときにもユーザーを適切な窓口に誘導できる。今回は、大阪と宇宙へ出張に行く際の経費について質問してみたが、見事に回答してくれている。

宇宙に出張する規定はないので、LINE WORKSで問い合わせるように回答

RAGは高度な意思決定支援システムへと発展する可能性を秘めている

 生成AIでRAGを利用できれば、単なる業務効率化だけでなく、組織全体の知識活用を促進する価値が生まれる。社内に散在していた情報資産を有効活用できるようになり、部門間の知識共有も進みやすくなる。社員一人ひとりが必要な情報に素早くアクセスできるようになれば、意思決定のスピードも向上するだろう。

 RAGは、将来的には社内データだけでなく、業界ニュースや市場動向といった外部情報とも連携させた高度な意思決定支援システムへと発展する可能性を秘めている。そのためにも、RAGで必要なデータをしっかりと用意しておく必要がある。もし、まだペーパーレス化やデジタライゼーションができていないなら、一刻も早く手を付けて、生成AIの活用に進んで欲しい。

著者プロフィール:柳谷 智宣

IT・ビジネス関連のライター。キャリアは26年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛ける。近年はAI、SaaS、DX領域に注力している。日々、大量の原稿を執筆しており、生成AIがないと仕事をさばけない状態になっている。

・著者Webサイト:https://prof.yanagiya.biz/

柳谷智宣のAI ウォッチ! 記事一覧