全文検索エンジン「Namazu for Win32」v2.0がリリース
Word文書やPDF形式のファイル内容の検索にも対応
(00/02/22)
全文検索エンジン「Namazu for Win32」v2.0が、21日にリリースされた。ディスク上のファイルやWebページの内容を文字列検索する際に利用できる検索エンジンで、v2.0ではテキストファイルだけでなくWord文書やPDFファイルの内容検索にも対応した。Windows 95/98/NT 4.0/2000に対応したフリーソフトで、現在作者のホームページからダウンロードできる。実行には、あらかじめPerlインタープリター「ActivePerl」と、漢字をひらがなやローマ字に変換するツール「Kakasi for Win32」をインストールしておく必要がある。
「Namazu for Win32」は、ディスク上のファイルやWebページの内容を文字列検索する際に利用できる検索エンジン。GREPツールのようにハードディスク内のファイルの内容を文字列検索したり、CGIを実行できるWebサーバーのホームページで「Namazu for Win32」を利用することでサーバー内のWebページを文字列検索できる。一致する文字列が見つかったファイルの内容を一部分のみリスト表示するなど、検索結果の表示方法は好みの書式にカスタマイズすることが可能だ。
「Namazu for Win32」は、検索対象のファイル内容をあらかじめプログラムが扱いやすいよう「インデックス化」し、インデックスファイルを新しく作成する。検索を実行するときにはインデックスファイルのみを対象に文字列検索を行うため、効率的にファイル内容を検索できる仕組みになっている。大量のファイルや大きなサイズのファイルを検索する場合でも、高速に目的の文字列を見つけ出すことが可能だ。自分のホームページ上でCGIとして動作させる際は、テキスト入力エリアやボタンなどを貼り付けた検索用のページが自動生成されるため、Webサーバーさえ正しく設定できればすぐにWeb検索エンジンとして活用できる。
v2.0では、漢字コード変換ツール「NKF」や「Text::Kakasi」というPerlインタープリターのモジュールとともに利用することで、「インデックス化」を高速に行えるようになった。また、テキスト形式のファイルだけでなく、Microsoft WordやPDF形式のファイルのほか、学術論文などの作成に用いられることの多いTeX形式のファイルも検索可能になり、実務作業や研究などより多くの場面で「Namazu for Win32」を利用できるようになった。
【著作権者】GNU GENERAL PUBLIC LICENSE Version 2準拠
【ソフト種別】フリーソフト
【バージョン】2.0(00/02/21)
□Top of the kenzo-'s Web Page
http://www.tama.or.jp/~kenzo-/
(日沼 諭史)