いまさら聞けないExcelの使い方講座

【Excel】PDFの表を最も簡単・キレイに抽出する方法 ~コピペ不能、レイアウト崩れも解決

PDFファイル内の表はCopilotで簡単に整えられます

コピペ後にデータ整形? Copilotが断然便利

 改ざんやレイアウト崩れを防止するために、「表」がPDFファイルとして送られてくることがありますよね。売上データや名簿、アンケート結果など、さまざまなシーンで利用されます。

 しかし、PDFファイルに含まれる表の再利用を考えて、コピーしてExcelへ貼り付けると、レイアウトが崩れてしまうことが多いものです。

PDFファイルの表をコピーしてExcelへ貼り付けると、レイアウトが崩れることがありますよね?

 さらに厄介なのが、紙の資料をスキャンして作成されたPDFファイルです。そもそもデータをコピーできない状態です。

紙の資料をスキャンしたPDFファイルの場合、コピーするためにドラッグしてもデータを選択できません

 単純にデータを再利用したい場合や、手軽に抽出したい場合は、Copilotを活用することをおすすめします。文字が認識できるOCR済みのPDFファイルだけでなく、文字を選択できないスキャンしたPDFファイルにも対応できます。

 もちろん、Power Queryを利用して、PDFファイルを取り込む方法もあります。画像の場合は[画像から]を利用して取り込むことも可能ですが、手間や精度を考えるとCopilotを使うのが効率的です。

 機密性の高いファイルを扱う場合は、操作の手間は増えてもPower Queryなどを使うほうがデータをAIへ渡さずに処理できるメリットがあります。自社のルールや利用環境を確認して使い分けるといいでしょう。

機密性の高いデータは従来の取り込み方法も検討してください

OCR済みならExcelのCopilotが便利

 文字を選択できるOCR済みのPDFファイルなら、データをコピーして、Copilotに貼り付けてプロンプトを入力するだけです。列や行を整理した表形式で出力されるので、[完了]をクリックして完成です。

これらのデータを表形式に整えてください

PDFファイル内の表をドラッグして選択し(①)、[Ctrl]+[C]でコピーします(②)
Copilotを呼び出して、コピーしたデータを貼り付け(③)、上記のプロンプトを入力します(④)
[完了](⑤)をクリックします
表が挿入されました。ある程度の書式も整っています

スキャンしたPDFはスクリーンショットを利用する

 紙の資料をスキャンした文字を選択できないPDFファイルの場合は、WebブラウザーでCopilotを利用しましょう。PDFファイルを画面に表示した状態でスクリーンショットを取得して貼り付けて、プロンプトを入力します。

この画像からデータを抽出して表形式に整えてください

 PDFファイルそのものをEdgeにドラッグ&ドロップしても構いませんが、必要な箇所だけを撮影したほうが読み取りの精度が上がります。撮影範囲を指定してスクリーンショットを撮影するショートカットキーは[Windows]+[Shift]+[S]です。

 なお、本稿執筆時点で「Excel形式で出力してください」のように指示すると、期待通りの結果にならないことがあります。単純に“表形式で”と指示して、結果をコピーするのが無難です。

PDFファイルを開いた状態で[Windows]+[Shift]+[S]キーを押すと(⑥)、範囲を指定してスクリーンショットを撮影できます
必要な箇所をドラッグして撮影します(⑦)
WebブラウザーでCopilotを開いて撮影したスクリーンショットを貼り付け(⑧)、上記のプロンプトを入力します(⑨)
[テーブルのコピー](⑩)をクリックします
Excelを開いて貼り付けたいセルを右クリックし(⑪)、[貼り付け先の書式に合わせる](⑫)をクリックします
データが貼り付けられました

 Excelにデータを貼り付ける際に[Ctrl]+[V]キーを押しても構いませんが、Copilotの回答に含まれるリンクも貼り付けられてしまいます。ここでは、ハイパーリンクを解除する手間を省くために[貼り付け先の書式に合わせる]を選択しています。

 どちらの方法も、PDFファイルの表をExcelで再利用する機会が多い人は、一度試してみる価値のある方法です。