ニュース

紙書籍を「自炊」している人に福音? スキャンデータを徹底的に読みやすくする最強ツール

作者は「SoftEther VPN」などで知られる登大遊氏

 「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。

スキャンデータを徹底的に読みやすくするというツールが「GitHub」で公開

 デジタルスキャンした書籍がなんか読みにくいなぁ……と感じたことはありませんか? それを解決してくれそうなソフトが「GitHub」で公開されています。ライセンスは「AGPL-3.0」。作者は「SoftEther VPN」などで知られる登大遊氏です。

 本ソフト「DN_SuperBook_PDF_Converter」は、紙媒体をスキャンしてPDF化(いわゆる「自炊」)したドキュメントをAI、OCR(光学文字認識)、ヒューリスティック処理などを駆使して“徹底的に”読みやすくするもの。とくに古い書籍をスキャンしたときにありがちな、7つの主要課題が解決されているらしいです。

  • 画質の低さ。汚れ・裏写り・モアレ・にじみ
  • ページの傾き
  • ページごとの位置ズレ。ガタつき
  • 余白トリミングによるページ間の不揃い
  • PDFページ番号と書籍ページ番号のズレ
  • 見開き時の左右ページの誤判定
  • 縦書き書籍の右→左ページ順の扱い

 高画質化は「Real-ESRGAN」と呼ばれるAIエンジン(と、C#で自作したかなり行き当たりばったりのアルゴリズム)で実現されているとのことで、その効果はかなりのようです。

AIやらなんやらでめっちゃキレイにしてくれるだけでなく、自炊でありがちな問題があらかた解決されるらしい

 「DN_SuperBook_PDF_Converter」の動作はローカルPCで完結するため、データがクラウドサービスへ送出されることはありません。ただし、必要な依存ツールを用意して、自分でビルドしなければならないのはちょっとハードルが高いかも。

 また、メモリを大量に消費する点、そこそこのGPUが必要になりそうな点(NVIDIAの「CUDA」に対応した「GeForce」シリーズを推奨)、x64版のWindows 10/11以外では動作が確認されていない点なども、場合によってはネックになるかもしれません。

 それでも頑張るぜ! というガッツのある自炊erは、ぜひ試してみてください!