いまさら聞けないExcelの使い方講座

【Excel】PDF上の表は手入力しなくても簡単に取り込める! 紙のスキャンデータでも大丈夫

PDFのデータをエクセルの表に変換するには?

PDFのデータをエクセルの表に変換したい!

 元のデータがPDFファイルしかないので、仕方なく手入力した……。そんな経験ありませんか? テキストをコピーできても、思い通りに貼り付けられないことがほとんどです。数値がコピーできているだけマシと考えて、崩れた表を力技で整えたこともあるかもしれません。

PDFファイルに含まれるテキストをコピーして、
エクセルに貼り付けると、残念な状態になります。

 紙の書類をスキャンしたPDFでは、テキストもコピーできないため、手詰まりに思えますが、諦めなくても大丈夫です。今回はPDFファイルからエクセルの表に変換するコツを2つ紹介します。

紙の書類をスキャンしたPDFはテキストのコピーもできませんが、諦めなくても大丈夫です。

テキストがコピーできるなら「Power Query」が便利

 「Power Query」(パワークエリ)は、Excel 2016から搭載された機能です。外部データとの接続に利用することが多い機能ですが、PDFからのデータの取り込みにも対応しています。取り込み時のデータの修正や、列の分割・結合も可能です。

[データ]タブ(①)の[データの取得]-[ファイルから]-[PDFから](②)の順にクリックします
[データの取り込み]ダイアログボックスで取り込みたいPDFを選択します。[ナビゲーター]の画面で[Table001(Page1)](③)をクリックします。テーブル名は取り込むPDFファイルによって変わります。取り込みのイメージ(④)にデータの内容が表示されます。問題はなさそうですが、[Power Queryエディター]の画面を表示して確認してみましょう。[データの変換](⑤)をクリックします
[Power Queryエディター]の画面に切り替わります。区切り位置や列の順番などを変更できます。1行目に「Columun1」などと見出しが入っているので変換します。[1行目をヘッダーとして使用](⑥)をクリックします。
1行目の見出しが変更されました(⑦)。[閉じて読み込む](⑧)をクリックします
PDFのデータがエクセルの表に変換されました

「Microsoft 365(Office)」でスキャン&OCR

 紙の書類をスキャンしたPDFファイルの処理方法を考えましょう。テキストがコピーできないということは、テキストデータが記録されていないので、何らかの方法で文字認識(OCR:Optical Character Recognition)の処理が必要になります。マイクロソフト提供の[Microsoft 365(Office)]アプリ(無償)を利用しましょう。

 残念ながらPDFファイルを直接OCR(文字認識)できませんが、撮影した画像のOCRは可能です。ここでは、スキャンしたPDFファイルが手元にあって“紙”がない前提なので、モニターに表示した画面を撮影してOCRをかけてしまいます。

 紙を撮影するほうが認識精度は高いですが、以下のような操作でも許容範囲の仕上がりになります。すべてのデータを手打ちするよりは効率がいいでしょう。

「Microsoft 365(Office)」をスマートフォンにインストールして起動しておきます。[アプリ](⑨)をタップして、[スキャンツール]の[開く](⑩)をタップします
[画像から表へ](⑪)をタップします
モニターに映したPDFファイルの画面を撮影します(⑫)
認識範囲がずれている場合は、四隅のハンドルをドラッグして調整します(⑬)。[確認](⑭)をタップします
問題のある箇所は強調されるので、セルのタップでポップアップを表示して[編集](⑮)を選択し、修正します。エクセルで修正すると割り切って、画面左下の[開く]をタップしてファイルを保存しても構いません
ほかの箇所も修正します(⑯)。[開く](⑰)をタップします
文字認識されて表が作成されました。任意の名前を付けて保存しておきます
OneDriveに保存したファイルをパソコンのWebブラウザーで開きました。少し調整すれば完成です

標準機能と公式アプリを使いこなそう

 「Power Query」はPDFの読み込みだけでなく、CSVファイルなどの処理にも便利な機能です。専門的に見えて避けられがちですが、いろいろなシーンで活用できる優れものです。また、[Microsoft 365(Office)]アプリは、無償でスキャンとOCR機能が使えてかなりお得です。ぜひ活用してください。