柳谷智宣の「実は色々できるPDFの活用法」
【DeepL&ChatGPTでPDF超活用!】英語のPDF文書をAIサービスを使って手軽に日本語に翻訳・要約する方法
ADA、AskYourPDF、BingAIチャットでPDFをもっと使える情報収集ソースに
2023年10月3日 06:55
情報収集をする際、外国語の文書がPDFになっているとやっかいだ。一般的なWebページなら、Webブラウザーの翻訳機能で日本語にできるが、PDFファイルだとビューワーで開くしかない。そこからテキストをコピー&ペーストしたり、Word形式に変換したりして、翻訳していることだろう。この手間が面倒で、外国語のPDFはあまり読まない、という人も多いのではないだろうか。
とはいえ、やはり最新情報は英語文書で出回ることが多く、情報収集するなら見逃す手はない。そこで今回は、PDF文書をAIサービスを使って、手軽に日本語に翻訳したり、要約したりする方法を紹介する。
PDFファイルをドラッグ&ドロップするだけで日本語PDFにする
外国語のPDFファイルをドラッグ&ドロップするだけで、日本語のPDFファイルに変換してくれるのが「DeepL翻訳」だ。2017年にローンチしたドイツ発のAI翻訳サービスで、日本語も含む31言語に対応している。それまでの一般的な翻訳サービスと比べて、より自然な文章で翻訳しているので人気を集めている。
「DeepL翻訳」は無料で利用でき、有料プランはスターター(月額1,200円)、アドバンスド(月額3,800円)、アルティメット(月額7,500円)の3つが用意されている。今回紹介する「PDF変換」は無料プランで利用できる。
さて「Smartphone security」という英語のPDF文書を翻訳してみよう。中身はWordで5ページ分、90センテンスで1,249単語、8,200文字で、数枚の画像も含んでいる。ファイルサイズは250KBだ。
DeepL翻訳のWebサイトを開き、[ファイルの翻訳]をクリック。英語のPDFファイルをドラッグ&ドロップし、[訳文の言語 日本語]をクリックする。文書の変換が終わると、自動的にPDFファイルがダウンロードされる。正常にダウンロードされなかったら[もう一度ダウンロード]をクリックすればよい。
翻訳されたPDFファイルのファイル名には「_ja」という文字が追加されているので開いてみよう。見事、日本語になっているはずだ。なお、無料版を利用する場合は、上部にDeepLの広告が入っている。
文章が日本語になっている上、レイアウトや画像はそのままなので読みやすい。最新情報を日本語のPDFで読めるのはとても便利だ。
ちなみに、プランによって制限がある。例えば、無料版で変換する場合は、有料版の広告が入るほか、翻訳できる文字数が10万文字までとなっている。ファイルサイズは5MBまでで、1カ月に3ファイルまでしか翻訳できない。また、元ファイルにセキュリティがかかっていなかったとしても、変換したPDFファイルは“編集禁止”となっている。テキストを選択したり、コピーすることもできない。もちろん、他の形式にエクスポートすることもできない。
ビジネスで利用するなら、より自由度の高い有料プランを契約すべきだ。一番安いスタータープランでも、翻訳文字数に制限がなくなり、1カ月に5ファイルまで翻訳できる。ファイルサイズも10MBまでと倍増するのだ。編集制限もなく、テキストを自由に活用できるのもよい。
PDFをドラッグ&ドロップするだけで、中身が日本語になるのは非常に捗るので、ぜひ無料プランでこの便利さを体感して欲しい。
ChatGPTにPDFファイルをアップロードして要約したり質問できる
いま、大ブレイク中のテキスト生成AI「ChatGPT」でもPDFの翻訳や要約が可能だ。それだけでなく、PDFの中身について質問することもできる。ただし、無料プランでは利用できず、有料の「ChatGPT Plus」プランの契約が必要になる。料金は月額20米ドルだ。
まずChatGPTを開いたら、[GPT-4]をクリックして「Advanced Data Analysis(ADA)」にチェックを入れる。以前は「Code Interpreter」と呼ばれていた機能で、ChatGPT上においてプログラミング言語「Python」でプログラムを書き、実行までできる。プログラマーでなくても、自然言語でプログラムを作成できるのが驚きだ。
ADAにチェックを入れたら、外国語のPDFファイルをChatGPT上にドラッグ&ドロップする。プロンプトの入力フォームにファイルのアイコンが追加されるので、指示を入力する。ここでは「このPDFを翻訳してください」と入力してみよう。
翻訳したテキストファイルが生成されたのだが、単語の間にスペースが入ったりして、あまり使い物にならなかった。しかし、ご安心を。ChatGPT自体はきちんと内容を理解しているので、質問すればよい。まずは、どんな内容のPDF文書なのか聞いてみよう。
全体の要約だけでなく、何でも質問できる。特定の項目について紹介してもらったり、こちらの意見を述べてもよい。文書の作者と話すように、自由に会話できるのがChatGPTの魅力だ。
ChatGPTにWeb上のPDFを読み込ませて要約したり質問できる
Web上で公開されているPDFであれば、ダウンロードしてアップロードせずに、そのままURLを「ChatGPT」に入力して、要約したり、質問したりできる。
[GPT-4]をクリックし、今度は「Plugins」にチェックする。ChatGPTには数百種類のプラグインが公開されており、さまざまな機能を利用できる。PDFを読み込むプラグインはいくつかあるが、今回は「AskYourPDF」を利用してみよう。プラグインで「AskYourPDF」を選択した状態で、PDFのURLを入力する。プロンプトは「PDFを読み込んでください」でOKだ。
ここではFBIが公開しているネット詐欺のレポートPDFを読み込んでみよう。もちろん英語文書だ。
プロンプトを入力すると要約が表示される。内容に関して質問することもできる。回答が何ページに載っているのかも教えてくれるのでありがたい。
Microsoft Edgeなら閲覧中のPDFについて要約したり質問できる
最新の「Microsoft Edge」には「BingAIチャット」が搭載されている。ChatGPT Plusと同様「GPT-4」をベースにしたAIで、こちらは無料で利用できる。チューニングがChatGPTと異なり、検索に特化しているのが特徴だ。ファイルをアップロードすることもできない。しかし、前述のプラグインのような操作は可能になっている。
例えば、PDFファイルを開いた状態で「このPDFを要約してください」とプロンプトを入力すると、日本語で要約してくれる。ChatGPTと同様、文書の内容について質問しても、数字まできっちり回答してくれる。
以上が、英語のPDF文書をAIサービスを使って手軽に日本語に翻訳・要約する方法となる。以前はできなかったり、とても手間がかかっていた作業が、AIサービスを利用することで超手軽にできるようになっている。これからは、PDFファイルも情報収集ソースとして存分に活用してほしい。
著者プロフィール:柳谷 智宣
IT・ビジネス関連のライター。キャリアは25年目で、デジタルガジェットからWebサービス、コンシューマー製品からエンタープライズ製品まで幅広く手掛けている。日々、大量の原稿を執筆しており、PDFファイルも日常的に利用している。メインのPDFツールは「Acrobat Pro」を活用。
・著者Webサイト:https://prof.yanagiya.biz/