OCRとは?
「e.Typist v.15.0」は印刷された活字文書を、スキャナなどを利用して画像データとして取り込み、 テキストデータに変換する活字OCRソフトです。
|
ここではOCRソフトの基本的な作業の流れをご説明します。
STEP1:取り込み
活字OCRソフトは、活字文書が印刷された書類・新聞・雑誌のほか、文章を撮影したデジカメ写真、すでに画像として保存されているデータなどを取り込むことができます。
1.スキャナから原稿を読み取り
2.画像ファイルを開く
3.デジカメからの読み込み
また、スキャナやデジカメからすでにパソコンに保存した画像を取り込む事もできます。
STEP2:認識
活字OCRソフトで文字を認識します。通常は原稿を見ながらキーボードで入力する作業が必要ですが、活字OCRソフトを使用することで原稿を素早く「テキストデータ」(キーボードで入力したものと同じ)に変換します。
テキストデータにすることで
1.文章の修正・追加
2.必要な文書を抜き出して再利用
3.原稿本文の全文検索
4.英文なら翻訳ソフトへデータ転送
など、様々なメリットがあります。
STEP3:保存
認識したテキストは様々なソフトで利用できるよう、ファイル保存形式を選択できます。
文章と画像の原稿であればWordやPDFファイルで保存することで、元原稿のレイアウトを再現できます。また、表原稿であればExcelファイルで保存すれば数値の修正なども可能です。
このように、活字OCRソフトはアナログの文書原稿を、デジタル化することでさまざまな情報を再利用することができる商品です。
※e.Typistシリーズは「活字文字」専用のOCRソフトです。「手書き文字」の認識はできません。手書き文字のOCRは別途手書きOCR商品をご覧ください。