ぼんやりDTP

DTPに関係したりしなかったりするぼんやりとした話をなんとなく。

アラビア語のOCR

アラビア語の画像からテキストを取得したい。

AcrobatOCR には入ってないっぽいので他の手段を探す。

ざっと試した限りでは、Google Docs 使うのが一番精度高かった。

身も蓋もない。

以下手順。

  1. Google Driveに画像をアップロード。
  2. 画像をコンテキストメニューからGoogleドキュメントで開く。
  3. 待つ。言語を指定することさえしない。
  4. 結果が表示される。

参考ページ:

  1. Googleドライブで、画像やPDFの文字をテキストにするOCRにかける方法 | 経験知

その他、オンラインで試したやつ。

  1. アラビア語 OCR (光学文字認識)。オンライン フリー — Convertio
    • なかなかいい。
  2. 無料オンラインOCR - オンライン画像認識 - 無料のOCRソフトウェア - 無料のOCRからWordへの変換 - オンラインでのテキスト認識の変換 - 写真のテキスト認識ソフトウェア - 写真からテキストへ
    • これもまあまあ。
  3. OCR - JPG、PNG、TIFFをオンラインテキストに変換する
    • ちょっと微妙かな