英文光学字符识别的后处理 |
| |
引用本文: | 吕学强,迟呈英.英文光学字符识别的后处理[J].鞍山钢铁学院学报,2002,25(3):192-196. |
| |
作者姓名: | 吕学强 迟呈英 |
| |
作者单位: | [1]抚顺师范高等专科学校数理系,辽宁抚顺113006 [2]鞍山钢铁学院计算机科学与工程学院,辽宁鞍山114002 |
| |
摘 要: | 总结了英文光学字符识别(OCR)系统中的常见错误类型,论证了使用拼写检查技术发现错误的可能性,以最相似单词替换OCR的错误输出,从而达到改正错误的目的。利用编辑距离实现词汇相似性评估,并用动态规划技术优化了编辑距离的计算。试验结果证明该方法可以使OCR系统的单词识别率提高6.25%。
|
关 键 词: | 英文光学字符识别 后处理 拼写检查 编辑距离 字符识别率 单词识别率 |
本文献已被 维普 等数据库收录! |
|