首页 | 本学科首页   官方微博 | 高级检索  
     

提高OCR识别率
引用本文:白桦.提高OCR识别率[J].数字社区&智能家居,2004(34).
作者姓名:白桦
摘    要:由于工作原因,笔者和同事们经常需要在家里录入一些文本资料,大家觉得用键盘慢慢敲击,手动输入实在是太麻烦。这不,最近大家都不约而同地购买了扫描仪,使用OCR来输入那些资料。但有好几位同事购买扫描仪后,常常抱怨说使用OCR识别效果很不理想识别率太低,盲目认为自己的扫描仪质量不好分辨率不够高。根据近半年长期使用OCR的经验,笔者肯定地告诉他们,造成OCR效果不佳的原因绝对不是扫描仪质量问题,也不是其分辨率不够高,而是操作上的问题。笔者在这里建议大家在使用OCR时应该注意如下几点:1、不要使用最高分辨率,300dpi足矣。过高的分辨率反而会使得OCR辨认困难,特别是在一些存在轻微扫描失真的扫描仪上。一般而言600dpi在针对一些字体特别小的稿件。2、手动清除干扰内容。由于纸张的原因,不少稿件在扫描都会有干扰的小点,此时建议在识别之前人工清除,这样可以避免很多怪异的字符。此外,OCR识别之前必须执行水平矫正,保证所有文字的水平。3、巧妙使用灰度扫描。对于一些纸张较薄的稿件,扫描时很可能因为透明而受到背面文字干扰,严重影响OCR成功率。为此,建议大家使用灰度扫描,尽管速度慢一些,但是效果会好很多。提高OCR识别率@白桦

本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号