首页 | 本学科首页   官方微博 | 高级检索  
     

小波的文本图像区分及其在文献信息数字化中的应用
引用本文:陈杰,孙忠贵,周书锋. 小波的文本图像区分及其在文献信息数字化中的应用[J]. 智能系统学报, 2010, 5(2): 185-188. DOI: 10.3969/j.issn.1673-4785.2010.02.015
作者姓名:陈杰  孙忠贵  周书锋
作者单位:1. 聊城大学,图书馆,山东,聊城,252059
2. 聊城大学,数学科学学院,山东,聊城,252059
基金项目:聊城大学青年教师科研基金 
摘    要:目前,OCR技术对文本图像区域自动区分的效果还不够精确,进而影响了OCR技术在文献信息数字化过程中的工作效率.针对这一局限,提出了一种基于小波的文本图像区分方法.方法首先对扫描区域进行小波分解,然后使用分解系数构建分解能量,最后依据分解能量大小对文本图像进行自动区分.结果表明,该方法对文本图像的区分效果较好,减少了在使用OCR技术进行文献信息数字化时的人为干预,有利于提高文献信息数字化过程的自动化水平.最后通过实验仿真验证了该方法的有效性.

关 键 词:数字化文献  小波  文本图像

Applying image classification using wavelets to digitization of document information
CHEN Jie,SUN Zhong-gui,ZHOU Shu-feng. Applying image classification using wavelets to digitization of document information[J]. CAAL Transactions on Intelligent Systems, 2010, 5(2): 185-188. DOI: 10.3969/j.issn.1673-4785.2010.02.015
Authors:CHEN Jie  SUN Zhong-gui  ZHOU Shu-feng
Affiliation:CHEN Jie1,SUN Zhong-gui2,ZHOU Shu-feng2 (1.Library of Liaocheng University,Liaocheng 252059,China,2.College of Mathematics Science,Liaocheng University,China)
Abstract:The accuracy of optical character recognition (OCR) technology in distinguishing between text areas and image areas has remained relatively low.Unfortunately this reduces the efficiency of OCR in digitization of document information.After analyzing the main steps of OCR applied to a digital library,the authors evolved an image classification algorithm based on wavelets.Decomposing the scanning area with wavelet transform was the first step in the algorithm.The energy value of the area could then be derived ...
Keywords:OCR
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号