NEWS


Webページ内の必要な情報だけを抽出する「ビジュアルベック」v0.70

フローチャートでスクリプトを作成し、Webページの情報を抽出

(00/09/26)

「ビジュアルベック」v0.70  Webページ内の必要な情報だけを抽出し、テキストファイルに出力できる「ビジュアルベック」v0.70が、26日にリリースされた。収集用のスクリプトを、フローチャートを組み立てながら比較的容易に作成できるのが特長だ。Windows 95/NT 4.0以降に対応したソフトで、現在作者のホームページからダウンロードできる。

 「ビジュアルベック」は、Webページ内の必要な情報だけを抽出し、テキストファイルに出力できるデータ収集ソフト。株価情報や、最新ニュース記事のタイトル、天気予報など、Webページ内の必要な情報だけを抽出する。収集用のスクリプトは、GUIの画面でフローチャートを組み立てながら作成するため、PerlやJavaScriptなど一般的なスクリプト言語に比べて容易に作成できるのが特長だ。抽出した情報は、テキストファイルに自由な書式で出力できる。

 収集用のスクリプトは、GUIの画面でフローチャートを組み立てて作成する。情報は、対象Webページのソースの先頭から抽出していく仕組みで、抽出したい情報の前後にあるHTMLタグや文字列をキーワードとして設定する。例えば、“<TITLE>”があったら“</TITLE>”の直前までの文字列を変数“title”に代入する、といったフローチャートを組み立てるわけだ。必要な情報をすべて抽出できるようにフローチャートを作ったら、抽出した情報をファイルに出力する命令をフローチャートの一番最後に繋げよう。

 スクリプトが完成したら、[ファイル]メニューから[実行]コマンドを選択する。次にURLの入力画面が表示されるので、情報を収集したいWebページのURLを入力しよう。すると、Webページの読み込みが始まり、指定したテキストファイルに収集した情報が出力される。スクリプトがうまく動作しない場合は、スクリプトを実行しながら変数の入力履歴などを確認できる“テストパターン”機能を利用して、デバッグするとよい。

【著作権者】ジュモンドットコム
【ソフト種別】フリーソフト
【バージョン】0.70(00/09/26)

□ジュモンドットコム
http://www.jumon.com/

(新城 雅章)

トップページへ


Copyright (c) 2000 impress corporation All rights reserved.
編集部への連絡は mado-no-mori-info@impress.co.jp まで