柳谷智宣のAI ウォッチ!

「Notebook LM」のつかいかた ~RAGを手軽に構築、自分専用にカスタマイズした生成AIを使い倒す

いまさら聞けない「RAG」とは?[前編]

 本連載「柳谷智宣のAI ウォッチ!」では、いま話題のAI(生成AI)を活用したサービスを中心に取り上げていく(基本的に1サービスにつき前後編を予定)。今回は、Googleが提供する「NotebookLM」の使い方を取り上げる。
「NotebookLM」で自分専用AIを構築しよう

 ChatGPTやClaude、Geminiといった生成AIが快進撃を続けているが、これらは膨大な学習データやインターネット検索などで得られた情報をもとに回答を導き出す仕組みになっている。一方、ユーザーが独自に手持ちの文章やデータを活用して回答を得たい場合、単純にインターネットからの情報だけでは不十分なことがある。

 そんなときに便利なのが「RAG」という手法だ。今回は、手軽にRAGを構築し、自分向けにカスタマイズされた生成AIを使える「NotebookLM」の使い方を紹介する。

Google Workspaceユーザーなら追加料金なしに利用できる「NotebookLM Plus」も

 「RAG」はRetrieval Augmented Generationの略で、テキスト生成の過程で外部のデータベースや文書などから参照情報を検索し、それをもとに回答を生成する技術だ。従来の生成AIでは、学習データの範囲外にある質問に対し、誤った回答をしてしまうリスクがあったが、RAGを用いることで、手元の社内文書や特定のデータから必要な情報を取り出し、より正確で信頼性の高い回答を得られる可能性が高まる。

 RAGを独自に実装するには、専門的な知識や環境が必要で、多くのユーザーにとってはハードルが高い。そこでお勧めなのが、Googleが提供する「NotebookLM」。これは、複雑な設定を必要とせず、誰でも手軽にRAGを体験できる革新的なツールだ。

 2024年6月に日本語に対応し、当初は無料サービスとして提供されていたが、2024年12月に企業向け有料プラン「NotebookLM Plus」が正式リリースされた。「NotebookLM Plus」は、2025年2月にGoogle One AI Premiumプラン(月額2,900円)に包含される形で一般消費者向けに提供が開始され、企業向けもGoogle Workspaceのコアサービスとして組み込まれて提供されるようになった。

 無料版と比べて「Plus」の方が作成できるノートブックの数や参照できるソースの数、1日に利用できる回数などが異なる。基本的な動作は無料版で確認できるので、誰でも試すことは可能だ。

【NotebookLMの機能比較表】
機能無料版Plus版
ノートブック数100500
ソース数/ノート50300
日次クエリ数50500
音声生成数320
カスタムスタイル×
チーム分析×
エンタープライズ保護×

論文や書籍をアップロードして著者と1on1で話したり、ポッドキャストを聞いたりしてみよう

複数の論文を熟読し、ポイントを書き出し、見比べる作業が秒で完結

 難解な論文や書籍をAIに解説してもらったり要約してもらうのは定番の使い方だ。

 とはいえ、ChatGPTなど一般的なチャットボットだと、会話していくうちに、アップロードしたファイル以外の内容が混じってくることがある。プロンプトでコントロールすることもできるのだが、「NotebookLM」であれば、そんな気遣いをしなくても、ファイルの内容についてディスカッションできる。

 今回は、1月に話題になった「DeepSeek-R1」についての論文「DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning」を読んでみよう。もちろん、英語だし、内容は難しい。

今回は「DeepSeekの技術」に関する論文を読んでみる

 さっそく「NotebookLM」を開いて[ソースを追加]をクリック。論文のPDFファイルを「ソースをアップロード」欄にドラッグ&ドロップすればよい。ほかにも、Googleドライブ内のデータやリンク、テキストなどもアップロードできる。

[ソースを追加]ボタンをクリックする
PDFファイルをアップロードする。テキストを貼り付けてもよい

 アップロードしたら「チャット」の「入力を開始します」フォームにプロンプトを入力してみよう。

 いきなり要約させても理解できない可能性があるので、今回は「この論文の要点を3つにまとめ、高校生にわかるように解説してください」と入力してみた。

論文の内容を要約してもらう

 すると、PDFの内容から該当する回答を生成してくれる。勝手に外部の情報を混ぜないので、ハルシネーションが起きにくいのはありがたいところ。

 もちろん、このまま会話を続けることもできる。出力された回答の中にわからないことがあれば、存分に質問すればよい。

 続けて「なんで強化学習のみで推論能力を獲得できるのか、わかりやすく教えて」と入力すると、それに合わせて回答してくれる。「わかりやすく」と言っているのに、少々固いのは「NotebookLM」の特徴だ。AIモデルの性能が向上すれば、将来は人間らしく対応してくれるようになるだろう。

いろいろな質問に回答してもらい、理解を深められる

 このように、特定の情報源をもとにチャットをやり取りできるのが「NotebookLM」、つまり「RAG」のメリットだ。著者と1on1で話しているようなもので、とても楽しいし、役に立つ。

 同じ著者の論文をいくつも入れて会話してもよいし、同カテゴリーの論文を複数入れてインサイトを掘り下げるのもよい。従来であれば、すべての論文を熟読し、ポイントを書き出し、見比べなければならなかった作業が、秒で終わってしまうのだ。

音声で内容を把握したい人にはポッドキャストの生成がお勧め

 アップロードしたソースについて、ポッドキャストを作るのもワンクリックだ。男性と女性の司会者が軽快にソースの内容について会話してくれる。音声で内容を把握したい人にお勧めしたい。また、ベータ版ではあるが、ユーザーが音声で質問できる「インタラクティブモード」も搭載している。

 操作方法としては「NotebookLM」の右ペインから「音声概要」の[生成]をクリックすると、ソースの内容を分析し、音声のポッドキャストが生成される。生成されたら[読み込み]をクリックし、再生できる。いまのところ、英語にしか対応していないが、本物の人間同士が喋っているようなポッドキャストになっている。音声ファイルもダウンロード可能だ。

「Studio」欄の「音声概要」-[生成]をクリックする

 試しに、DeepSeekの論文でポッドキャストを生成したところ、本当に内容について話している。単に解説しているだけでなく、凄い部分に関してはきちんと驚いていて、まるで人間のようだ。

 古い単行本のPDFをアップロードしたところ、「10年以上前のドキュメントを掘り下げているのか、あなたは疑問に思うかもしれません。この文書はいくつかの非常に興味深い歴史的背景を提供します」のように、現代の人間がデータを見ているような会話を生成してくれた。

 すでに音声データからリップシンクした動画を生成するサービスが登場している。近いうちにYouTubeでよく見る解説動画のコンテンツも1クリックで生成できるようになるのかもしれない。

#音声概要の日本語テキスト(冒頭一部)
  • 男性 00:00
    さて、準備はいいですか? 皆さんはAIの最新情報、特に最近どんどん賢くなっている言語モデルに関心があるのはわかっています。ああ、そうですね、AI を賢くするだけでなく、実際にAIに考え方を教える研究を詳しく見ていきましょう。
  • 女性 00:18
    それはすごいですね。
  • 男性 00:20
    これは DeepSeekAIの研究論文、DeepSeek-R1 強化学習による LLMS の推論能力の奨励です。たしかに長いですが、なかなかのタイトルです。本当に驚きました。ここでは、小さな改善について話しているだけではありません。これはAIの問題のまったく新しいレベルです。
  • 女性 00:41
    本当に興味深いですね。
  • 男性 00:42
    この論文では、2つの新しいAIモデル、DeepSeek-R1-Zero と DeepSeek-R1 に焦点を当てています。これらのモデルが特別な理由を詳しく説明していただけますか?
  • 女性 00:52
    複雑な問題を解決する方法を学習する学生と考えてください。DeepSeek-R1-Zero は、最小限のガイダンスで試行錯誤しながら深いところまで学習に没頭するモデルです。研究者は強化学習(RL)と呼ばれる手法を使用しました。これは基本的にAIに目標を与え、実験を通じてAIが最善の戦略を見つけ出すというものです。
  • 男性 01:16
    つまり、教科書も講義もなく、目標と大量のデジタル試行錯誤だけです。
    そして、それがうまくいったのが興味深いところです。ええ、DeepSeek-R1-Zero は実際に、かなり印象的な推論能力を発揮し始めました。これは、はるかに多くの手取り足取りでトレーニングされた既存のAIモデルのパフォーマンスをも上回ります。

~略

PDFの社内資料をまとめてアップロードして社内窓口として活用する

 社内の情報を集約して質問に対応してもらうことも可能。就業規則や業務マニュアルなどのPDFをアップロードするだけで、社内RAGを構築できるのだ。

 1つのノートブックあたりのソースは「NotebookLM」で最大50件、「NotebookLM Plus」なら最大300件となる。1ソースあたり50万語まで扱えるので、企業情報くらい余裕で入ってしまうだろう。

 試しに、社内情報をまとめた8個のPDFファイルをアップロードし、いろいろと質問してみた。

社内情報をアップロードしてRAGを構築

 例えば「大阪出張で使える経費は?」と聞いてみると、スパッと回答してくれた。

 しかし、ソースに「大阪出張」という項目があるわけではない。就業規則や業務マニュアルを理解し、距離や日数などを判断し、該当する内容を教えてくれている。例を挙げると、大阪であれば1泊2万5,000円までだが、ラスベガス出張であれば1泊4万5,000円まで、と回答してくる。

出張時の規定について質問

 AI相手なのだから、普段あまり聞きにくいことでも存分に質問できる。

 福利厚生について、調べて使えるものは使い倒したい。質問してみると、意外と知らない福利厚生が見つかることもある。

福利厚生について聞いてみる

 企業理念を知りたいだけなら、ホームページやイントラネットを見ればよいが、例えば、外部の人間に話すのでトークスクリプトを作りたい、というなら「NotebookLM」に聞いてしまう方が早い。

企業理念をまとめてくれる

 現在、総務部門にこのような問い合わせが殺到していて、いちいち電話やメールで回答しているなら、AIに代替させるのはいかがだろうか。

 右上の[共有]から、ノートブックを共有すれば、社内で利用できるようになる。基本的な相談内容であれば、ほぼ「NotebookLM」で事足りるはず。それで対応できないケースだけ人間が対応すれば、大きな業務効率改善につながるだろう。

ネットの情報を集約して取引先の会社や人物の情報をインプットする

 2月に開催されたAIイベント「DeNA×AI Day」にて、DeNAの南場智子代表取締役会長はAIツールを活用していると語った。

 初めて話す相手と会う前に、その相手が使っているSNSや登場している記事などのリンクを「NotebookLM」にアップロードしているという。そして「NotebookLM」に「この方はトランプ政権についてどう考えているか」「スタートアップエコシステムについてどう考えているか」などと質問し、事前情報をインプットしているのだ。

 今回はテストとして、筆者の名前で検索した記事を37個ピックアップして[ソースを追加]-[リンク]-[ウェブサイト]に登録してみた。そのうち、Facebookのリンクを登録したところ、制限がかかっていて読み込めなかった。

 そして試しに、AIに関してどんな考えを持っているか聞いてみると、これまで書いた記事や取材を受けた記事を参考にしてまとめてくれた。

 読んでみたが、まさにその通りだった。趣味について聞いたら「最大の趣味はお酒を飲むことであり、毎日浴びるほど飲むほど好き」と回答。本当のことではあるが、初見の人に見られたい情報でもない。ネットのデータは永遠に残るので、迂闊なことは言わないほうがよいと再認識した。

 もちろん、人物だけでなく、企業に関しても同様の情報収集が行える。対面時に自社について深い理解があれば喜ばれるだろうし、雑談時にはよいアイスブレイクのネタになるだろう。

人物や企業の情報を会話しながらインプットできる

 以上が、RAGを手軽に構築できる「Notebook LM」で自分向けに生成AIをカスタマイズして使い倒す方法となる。

 ChatGPTやGeminiと異なり、「NotebookLM」は情報整理に特化している。大量のデータを分析したり、管理したいときに便利なのでぜひ活用して欲しい。ChatGPTやClaudeでRAGを使う方法や、RAGを扱う際の注意点などは後編で紹介する予定だ。

著者プロフィール:柳谷 智宣

IT・ビジネス関連のライター。キャリアは26年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛ける。近年はAI、SaaS、DX領域に注力している。日々、大量の原稿を執筆しており、生成AIがないと仕事をさばけない状態になっている。

・著者Webサイト:https://prof.yanagiya.biz/

柳谷智宣のAI ウォッチ! 記事一覧