電子化に関するよくある質問 > OCR(オーシーアール)というのは、何ですか?


(Q)OCR(オーシーアール)というのは、何ですか?

(A)おおよそ、コンピュータが文字を読むことをさします。言い換えれば、コンピュータが文字を見て、それが何の文字であるのか、理解する、ということです。

OCR works by first pre-processing the digital page image into its smallest component parts with layout analysis to find text blocks, sentence/line blocks, word blocks and character blocks - a process known as zoning. Other features, such as lines, graphics, photographs, etc., are recognized and may be discarded for the purpose of text recognition. ・・・ correct zoning remains a significant issue for newspaper OCR accuracy.



http://www.dlib.org/dlib/july09/munoz/07munoz.html

というわけで、「OCRソフトは、まず、画像をどんどん分割していきます。1枚の画像の中から、文字が書かれている「テキスト領域」を特定し、そのテキスト領域を、「文」に分割し、それを「行」に分割し、それを「単語」に分割し、それを「文字」へと分割します。この分割作業を「ゾーニング」と呼んでいます。・・・このゾーニングをどれだけ正しく行うことができるのかが、OCRの精度を左右します。」

・・・ and character blocks are then further broken down into components parts, pattern-recognized and compared to the OCR engine's large dictionary of characters from various fonts and languages. When a likely match is made, this is recorded, and a set of characters in the word block are recognized until all likely characters have been found for the word block. The word is then compared to the OCR engine's dictionary of complete words that exist for that language.

というわけで、「・・・「文字」は、さらに「部分」に分割され、「部分」ごとに照合を行い、どの「文字」であるのか特定します。「単語」内の全ての「文字」が特定できたら、その「単語」が登録されている単語帳の中にあるか探します。」

このような手順で、コンピュータは、文字を読んでいきますが、当然、誤読をします。その誤読に関しては、「OCRの精度というのは、どのくらいですか?」をご覧ください。

そのほか、こちらもご覧ください。

質問一覧へ戻る


トップページへ戻る




Ferretアクセス解析