OCRソフトをざっと比較

ようやっとドキュメントスキャナで4冊ほど読み込みしてました。

結局薄い原稿の重送は避けられそうにないので、結局一枚ずつ読み取ることに。腕は痛くなりますがそれでもまあフラッドヘッドスキャナで開いて置いて閉めて読み込ませて開いて・・・という作業よりか幾分マシです。

で、読み取りならこれでいいのですが、せっかくだからテキスト検索もしたい!という場合に登場するのがOCRソフト。もちろんン十万するものを買えばそれなりにいけると思いますが、さすがにそこまで出費できないので、中堅どころのOCRソフト3本試してみました。

  • e.Typistエントリー2(IMAGE Formuraに付属していたもの)
  • 読取革命Ver.12(体験版)
  • 読んde!!ココ(体験版)

テストに使用した雑誌はWebDesigning。写真満載で読み取り難易度屈指のものです。

以降は単純な使用感を並べていきます。

e.Typistエントリー2

  • PDFファイルからの読み取りできない(画像ファイルのみ)
  • 画像を必死で文字化しようとする
  • 認識速度は速め
  • 埋め込みテキストでPDF出力した際、画像の解像度を勝手に落としてしまう

読取革命Ver.12

  • PDFファイル読み取り可能
  • 画像を必死で読み取ろうとする
  • 認識速度は極めて遅い

読んde!!ココ

  • PDFファイルからの読み取り可能
  • 画像はなるべく除外してくれる(単純図形は読み取ろうとする)
  • 単純文章の認識は非常に速い
  • 保存するときは1ページずつAcrobatに転送しないといけない

すごい漠然ですがこんな感じでした。どれも一長一短ですね。e.TypistがPDF読み取りに対応してくれたら比較なんて気にもとめなかったんですけどね。

正確な文章が必要ではなく(調整しだすとキリがないので)、だいたいすばやく認識してくれればOKなので、あまりもっさりしても困るわけで。そりゃ速くて正確ならそれに越したことはないですが。

OCRソフトをざっと比較” への1件のフィードバック

  1. 読んde!!ココ

    「読んde!!ココ Ver.13」は日本語OCRソフトだ。以前のバージョンに比べ文字認識率が向上した。原稿ファイルの方向・傾き補正も全自動でやってくれる。書籍・雑誌の電子化に威力を発揮する。

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中