ニュース

GPUなしで動作する軽量なAI OCRツール「NDLOCR-Lite」、国会図書館のラボから無償公開

コマンドライン版に加えWindows/Mac/Linux対応のデスクトップ版を用意

GPUなしでも動作する軽量OCRツール「NDLOCR-Lite」

 AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。

 「NDLOCR-Lite」は、国立国会図書館(NDL)が内製で開発したOCR(光学文字認識技術)アプリ。NDLラボは「NDLOCR」というOCRツールも無償で提供しているが、快適に利用するにはハイスペックなGPUが必須で、導入のハードルが高かった。その点、「NDLOCR-Lite」は一般的なノートPCで高速に動作するよう設計されており、動作にGPUは不要。誰でも気軽に利用できるのが魅力だ。開発に当たっては、古典籍資料向けの「NDL古典籍OCR-Lite」で得られた知見が生かされているという。

 「NDLOCR-Lite」には「Python 3.10」以降で動作するコマンドライン(CLI)版と、デスクトップで手軽に利用できるGUI版がある。一般のユーザーであれば、マウス操作で簡単に扱える後者のデスクトップ版がお勧めだ。Windows、Mac、Linuxがサポートされているので、リリースページからプラットフォームに適したバージョン(Windows環境であれば「ndlocr_lite_v1.0.0_windows.zip」)をダウンロードし、実行しよう。

 なお、その際は全角文字を含むパスに実行ファイルを置かないように注意。起動しない可能性があるという。

 GUI版アプリの使い方は簡単で、文字認識の言語、ソース(認識対象)となる画像、データを出力するフォルダーの3つを指定して[OCR]または[Crop&OCR]ボタンを押せばよい。言語は日本語と英語が選択可能。ソースとなる画像は単体ファイル、または画像ファイルの含まれているフォルダーを指定できるほか、デスクトップをキャプチャーしてソース画像とする[キャプチャモード]が用意されている。

 OCR処理が完了すると、ウィンドウ下部に認識結果のテキストと画像がプレビュー表示される。出力フォルダーにも、認識したテキストを保存したファイル、認識箇所を赤線でマークした画像ファイル、テキストと認識個所のデータが記述されたXMLファイルなどが出力される。

OCR処理が完了すると、ウィンドウ下部に認識結果のテキストと画像がプレビュー表示される

 フルスペックの「NDLOCR」は引き続き提供されるとのことだが、一般的なテキストのデジタル化であれば「NDLOCR-Lite」でも十分な品質を得られるだろう。「NDLOCR」が不得意としていた英文や手書き文字も、「NDLOCR-Lite」ならば実験的ながらカバーしている。状況に応じて、くずし字・漢籍に特化した「NDL古典籍OCR-Lite」と使い分けよう。

ソフトウェア情報

「NDLOCR-Lite」
【著作権者】
NDLラボ
【対応OS】
Windows/Mac/Linux(編集部にてWindows 11で動作確認)
【ソフト種別】
フリーソフト
【バージョン】
1.0.0(26/02/24)