首页 | 本学科首页   官方微博 | 高级检索  
     

批量图文文档的摹本识别
引用本文:董重明,陈鸿建.批量图文文档的摹本识别[J].电脑与信息技术,2003,11(3):5-9,62.
作者姓名:董重明  陈鸿建
作者单位:四川大学数学学院 四川成都610064 (董重明),四川大学数学学院 四川成都610064(陈鸿建)
摘    要:基于数据库的图文文档的摹本识别是办公自动化的一个重要研究内容。文章利用多元统计中的聚类分析,提出了一种对批量到达的图文文档进行摹本识别的方法。该方法首先把已读入计算机的单页图文文档转换为单色位图,给出若干互不相交的同心圆盘(固盘的中心按页的边缘计算),计算出各轴像素密度(各圆环内“on”象素的个数)作为图形的特征向量。在页面的特征向量之间建立一种距离,再进行聚类分析以识别文档的摹本。通过对从网上下栽的批量图形文档利用MATLAB进行多次仿真实验,单页文档的正确分类率达到了85%~98%。

关 键 词:摹本识别  图文文档  计算机  图形特征  办公自动化

Duplication detection of a batch of image documents
DONG Chong-ming,CHEN Hong-jian.Duplication detection of a batch of image documents[J].Computer and Information Technology,2003,11(3):5-9,62.
Authors:DONG Chong-ming  CHEN Hong-jian
Abstract:
Keywords:Office automation  Duplication detection  Radial pixel density  Cluster analysis  
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号