首页 | 本学科首页   官方微博 | 高级检索  
     

基于敏感点颜色聚类和行聚类筛选的文本提取
引用本文:刘琼,周慧灿,王耀南.基于敏感点颜色聚类和行聚类筛选的文本提取[J].计算机应用,2010,30(2):449-452.
作者姓名:刘琼  周慧灿  王耀南
作者单位:1. 湖南文理学院 计算机科学技术学院2. 湖南大学电气与信息工程学院
基金项目:湖南省科技厅计划项目“自然场景下的文本定位与提取方法研究”
摘    要:针对现有的文本提取算法不能适应复杂背景变化和文字本身的形状变化问题,提出一种基于敏感点颜色两级聚类和文本行聚类筛选的方法。新方法利用人眼视觉对颜色大幅度变化更敏感的特点,以敏感点的主要颜色作为聚类分析的依据,克服了现有阈值方法和聚类方法受背景颜色变化影响较大的问题。在此基础上,以文本行的空间排列特征为依据进进行文本行筛选,以克服一般方法容易受文字形状和尺寸变化影响的缺点。实验表明,新方法对于背景的复杂变化和文字的形状尺寸变化都具有很好的适应性。

关 键 词:文本提取    K均值聚类    边缘密度    文本行聚类
收稿时间:2009-08-09
修稿时间:2009-10-15

Text extraction based on clustering colors at sensible points and clustering text-lines for text-selection
LIU Qiong,ZHOU Hui-can,WANG Yao-nan.Text extraction based on clustering colors at sensible points and clustering text-lines for text-selection[J].journal of Computer Applications,2010,30(2):449-452.
Authors:LIU Qiong  ZHOU Hui-can  WANG Yao-nan
Affiliation:1.College of Computer Science and Technology/a>;Hunan University of Art and Science/a>;Changde Hunan 415000/a>;China/a>;2.College of Electrical and Information Engineering/a>;Hunan University/a>;Changsha Hunan 410082/a>;China
Abstract:Since the existing text extraction methods can not adapt to the variation of complex background and shape,a new method was brought forward.It was founded on two-level color clustering of sensible points and text-line clustering.Because human vision perception is more sensitive to great change of colors,the new method only selected the main colors at sensible points to cluster.The strategy could solve the problems of the existing methods based on threshold and clustering which were greatly influenced by the ...
Keywords:text extraction  K-means clustering  edge density  text-line clustering  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号