(1)OCRソフトが文字を誤認識する

OCRで文章を読み取ってテキストに変換する際、別の文字や記号と間違えて認識することがあります。 和文と英文が混在しているページにこの誤認識が多く起こります。 とくに縦書きの和文に横書きで英文が挿入されている場合は英文は完全に化けてしまいます。 なおOCRに特徴的な誤りは、「体」と「休」のように、見た目が似ている文字を誤認識することと、一つの文字を二つに分解してしまって誤認識することです。 また、網掛け文字や、白黒反転の文字などもOCRでは文字化けしてしまいがちです。
OCRソフト