いまさら聞けないExcelの使い方講座
【Excel】PDF上の表は手入力しなくても簡単に取り込める! 紙のスキャンデータでも大丈夫
2023年10月18日 06:55
PDFのデータをエクセルの表に変換したい!
元のデータがPDFファイルしかないので、仕方なく手入力した……。そんな経験ありませんか? テキストをコピーできても、思い通りに貼り付けられないことがほとんどです。数値がコピーできているだけマシと考えて、崩れた表を力技で整えたこともあるかもしれません。
紙の書類をスキャンしたPDFでは、テキストもコピーできないため、手詰まりに思えますが、諦めなくても大丈夫です。今回はPDFファイルからエクセルの表に変換するコツを2つ紹介します。
テキストがコピーできるなら「Power Query」が便利
「Power Query」(パワークエリ)は、Excel 2016から搭載された機能です。外部データとの接続に利用することが多い機能ですが、PDFからのデータの取り込みにも対応しています。取り込み時のデータの修正や、列の分割・結合も可能です。
「Microsoft 365(Office)」でスキャン&OCR
紙の書類をスキャンしたPDFファイルの処理方法を考えましょう。テキストがコピーできないということは、テキストデータが記録されていないので、何らかの方法で文字認識(OCR:Optical Character Recognition)の処理が必要になります。マイクロソフト提供の[Microsoft 365(Office)]アプリ(無償)を利用しましょう。
残念ながらPDFファイルを直接OCR(文字認識)できませんが、撮影した画像のOCRは可能です。ここでは、スキャンしたPDFファイルが手元にあって“紙”がない前提なので、モニターに表示した画面を撮影してOCRをかけてしまいます。
紙を撮影するほうが認識精度は高いですが、以下のような操作でも許容範囲の仕上がりになります。すべてのデータを手打ちするよりは効率がいいでしょう。
標準機能と公式アプリを使いこなそう
「Power Query」はPDFの読み込みだけでなく、CSVファイルなどの処理にも便利な機能です。専門的に見えて避けられがちですが、いろいろなシーンで活用できる優れものです。また、[Microsoft 365(Office)]アプリは、無償でスキャンとOCR機能が使えてかなりお得です。ぜひ活用してください。