残業を減らす!Officeテクニック
Excelに毎度同じWebサイト上のテキストデータをまとめる苦行は自動化で解脱!
Power Automate Desktopで表形式ではないWebページの情報をスクレイピング
2023年12月18日 06:55
Webサイトのテキスト情報をリスト化したいことがありませんか? コピー&ペーストで済ましてしまうこともあると思いますが、余計なリンクなどの不要な情報をいちいち削除するのが面倒ですよね。
Webサイト上の画像を一気に取得できるアドインなどは多いのですが、テキスト情報のスクレイピングとなると、結果として専門的なツールに導かれると思います。
もっと簡単・無料でコピペ代わりに働いてくれるツールがないものか? ということで、今回はPower Automate Desktopを使って、WebページのデータをExcelにまとめる方法を紹介します。
Power Automateは、Microsoftの提供するRPA(Robotic Process Automation)ツールです。Microsoft アカウントがあれば無料で利用可能。自分のPC内にあるアプリを制御するには、デスクトップアプリを入手します。
Webページ上のデータの取得・整形にChatGPTを利用する手もありますが、現時点で無料ユーザーはExcelデータへの出力は不可。また、ExcelのPower QueryからWebページにアクセスして情報を取得するなら、Webページの情報がテーブル形式でまとまっていることが前提です。
一方、Power Automate Desktopは無料。HTMLタグを指定できるため、柔軟にデータを取得することもできます。日頃、コピペで苦戦しているなら、試してみる価値はあると思いますよ。
新しいフローを作成する
Power Automate Desktopで自動化する処理は「フロー」としてまとめられます。任意の名前を付けて作成しましょう。新しいフローが作成されるとアクションを追加するウィンドウが表示されます。
アクションを追加する
アクションの追加は画面左側の一覧からドラッグ&ドロップするだけです。続けて必要な情報を入力する画面が表示されます。ここでは、以下のWebページから必要な情報を取得してみます。
追加するアクションは[新しい Chrome を起動する]と[Web ページからデータを抽出する]の2つのみです。なお、[新しい Chrome を起動する]を初めて追加する時、Power Automateのアドインをインストールするように要求されるので、許可して追加しておきます。
続けて、Webページから取得する要素を指定するため、[Web ページからデータを抽出する]アクションの画面はそのままにしておきます。閉じてしまった場合は追加した[Web ページからデータを抽出する]の項目をダブルクリックして再表示してください。
Webページから取得する要素を指定する
[Web ページからデータを抽出する]アクションで取得するWebページの要素を取得します。[Web ページからデータを抽出する]アクションの画面を開いた状態でWebブラウザーを選択します。
[ライブ Web ヘルパー]の画面が表示されて、Webページの要素にマウスポインターを合わせると赤い枠で強調されることがわかります。
要素をいくつか取得すると自動認識されますが、Webページの構造によって意図通りに動作しないこともあります。その場合は[ライブ Web ヘルパー]の画面下部にある[詳細設定]から、HTMLタグを直接指定するか、取得後にExcel上で整形します。
フローを実行する
作成したフローを実行してみましょう。画面上部の[実行]をクリックします。Webページの構造により、取得できていない箇所もありますが、くり返しコピペするよりは効率的でしょう。
ここで作成したフローを実行すると、Webページが開いたまま、Excelも表示されて未保存の状態です。アクションとして[Web ブラウザーを閉じる][Excel の保存]などを追加することで、さらにフローを充実させることもできます。ぜひ試してみてください。