窓の杜Logo

.
Review NEWS

Office文書やPDF/HTMLファイルのテキスト部分を抽出できる「xdoc2txt」が公開

出力されるファイルの文字コードをS-JIS/JIS/EUCで指定可能

(03/11/19)

「xdoc2txt」v1.06
「xdoc2txt」v1.06
 Office文書やPDF/HTMLファイルのテキスト部分を抽出したファイルを作成できる「xdoc2txt」v1.06が、9日に公開された。Windows 95/98/Me/NT 4.0/2000/XPに対応するフリーソフトで、現在作者のホームページからダウンロードできる。

 「xdoc2txt」は、Office文書やPDF/HTMLファイルなどのテキスト部分を抽出したファイルを作成できるソフト。テキスト部分を抽出可能なファイルの種類は「Word」v5.0/95/97/2000、「Excel」v5.0/95/97/2000、「PowerPoint」v97/2000、「一太郎」v5~12の文書ファイルのほか、「OASYS」のOAS/OA2/OA3形式ファイル、「Lotus 123」のWJ2/WJ3/WK3/WK4/123形式ファイル、PDF/HTML/RTFファイルなど。まず、本ソフトのショートカットアイコンをデスクトップなどに作成し、起動オプションを“-f”と指定しよう。作成したショートカットアイコンに、テキスト部分を抽出したい複数のファイルをドラッグ&ドロップすると、テキスト部分を抽出したTXTファイルが、元ファイルのファイル名のうち拡張子のみをTXT形式に変更した形で、元ファイルと同じフォルダに作成される。

 また、出力されるTXTファイルの文字コードはS-JISだが、起動オプションに“-j”や“-e”を追加することで、文字コードをJIS/EUCに変更することが可能。このソフトを利用すれば、Office文書などのような特定のアプリケーションが必要となるファイルでも、テキスト部分を簡易的に確認することができるだろう。なお、本ソフトはコマンドプロンプト上で利用するCUIタイプのアプリケーションであり、CUIモードでの実行時はヘルプを表示することもできる。

【著作権者】hishida 氏
【対応OS】Windows 95/98/Me/NT 4.0/2000/XP
【ソフト種別】フリーソフト
【バージョン】1.06(03/11/09)

□EB series support page
http://plaza3.mbn.or.jp/~h_ishida/

(中井 浩晶)


トップページへ
Copyright (c) 2003 Impress Corporation All rights reserved.
編集部への連絡は mado-no-mori-info@impress.co.jp まで