共查询到18条相似文献,搜索用时 125 毫秒
1.
基于聚类与边缘检测的自然场景文本提取方法 总被引:1,自引:0,他引:1
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域. 相似文献
2.
给定一个任意形状的平面区域,使用若干条折线段将该平面区域划分为子区域。当折线段存在不完全贯穿平面区域或包含于区域之中时,提出一种自适应算法,将其延长至最近边界以切割区域,并识别子区域输出。通过记录线段与交点的拓扑关系,并对部分线段进行延长处理,以形成记录全部端点问拓扑关系的网状结构,最终通过最小转角法搜索最佳路径输出全部子区域。实验结果表明,该方法能快速、无重复输出所有子区域,效果良好。 相似文献
3.
Hough变换的特性分析:一种全局观点 总被引:3,自引:2,他引:3
提出了Hough变换的投影观点,从全局的观点来看待(ρ,θ)空间中的所有投票点,研究了直线段在(ρ,θ)空间中对应的一簇正弦曲线.通过对正弦曲线簇,特别是与峰值点偏移π/2相位位置上的研究,提出了π/2线的概念.利用π/2线的性质实了图像中线段长度及线段是否间断等信息的提取,并构造了一个从(ρ,θ)空间恢复图像线段的算法.研究了通过2个峰值点的一条正弦曲线的特性,得到了图像中多条线段间的相交情况、交点坐标等信息.最后给出利用交点和峰值点直接重建物体轮廓线的算法. 相似文献
4.
5.
由于数显数字字符有其自身特点,相对于其它类型字符识别存在着新的难点,针对此类数显数字字符采用将细化后的字符图像看作是一幅连通图,选择闭合曲线作为其整体特征对十个数字字符进行初次分类,将笔画端点所处字符图像中四个子区域的位置作为主要的细节特征,对字符进行识别。测试结果表明该算法是可行、有效的。 相似文献
6.
7.
8.
为提高骨架提取的准确性和连通性,提出了一种利用模板和邻域信息的静脉骨架提取新算法,该算法首先对二值图像进行平滑,并通过自适应方法计算静脉纹路上所有像素点邻域之和,以快速区分出边缘点和中轴点,然后遍历图像找出所有符合中轴点模板的像素点,并删除其中的孤立中轴点之后,得到一些间断的中轴线段,最后从这些中轴线段的端点开始采用最大邻域点跟踪方法提取出静脉骨架。实验结果表明,该算法提取的静脉骨架与中轴线重合且平滑稳定,且具有尺度不变性,角度不变性和良好的抗噪性能,是一种有效的骨架提取算法。 相似文献
9.
10.
针对手写汉字笔画提取的重点和难点--模糊区域的识别和解析问题,提出了一种新的基于模糊区域检测的笔画提取算法.该算法首先利用细化算法提取的fork候选点和fork候选点附近的轮廓信息来检测模糊区域;然后利用图模型来对子笔画和模糊区域进行建模,同时通过构造贝叶斯分类器来分析子笔画对的连续性,并通过路径搜索来得到子笔画序列;最后通过进行B样条插值来提取细化后的笔画.对比实验结果表明,该算法不仅能够有效地用于模糊区域检测和笔画提取,而且能够避免细化结果在模糊区域内的形状畸变. 相似文献
11.
12.
基于DCSSM的文本特征提取及文本挖掘研究 总被引:2,自引:0,他引:2
梁开健 《自动化技术与应用》2005,24(5):54-56
提出了用模式作为复杂类型数据的知识表示方法,结合结构化数据挖掘给出了基于复杂类型数据知识发现的结构模型——发现特征子空间模型DCSSM。在此基础上讨论了文本特征提取及文本挖掘的方法。 相似文献
13.
介绍了一个数码管显示数字仪表表盘读数的自动识别系统,在字符提取阶段,采用颜色提取的方法,使得尽管图片的字体颜色与背景颜色相同,但只要亮度不同,也能很好的提取出字符部分.在字符分割过程中,采用增益方法识别边界,准确分割出单个字符.并采用统计法和扫描法相结合的方法来识别数字.实验结果表明提出的方案可行,具有较强的鲁棒性. 相似文献
14.
15.
中文数字墨水文本的分割结果包含单字、文本行和段落三个层次对象,单字在其中占有较大比例,情况复杂。使用自动的分割方法难以提供完全正确的单字提取结果,这时就需要进行人机交互校正单字提取结果。优化的可视化方法可以在人机交互时大大提高校正效率。面向交互校正错误的单字提取结果,针对单字结果间的邻近和重叠等情况,给出了一种自适应的可视化方法。该方法先生成单字的正放最小外接矩形,如果相邻矩形重叠,则改用凸包,仍然重叠,则给单字结果加上颜色。对多种数字墨水文本的单字提取结果进行可视化表示,取得了较好的效果。 相似文献
16.
基于语料库的领域词语聚类C#实现 总被引:1,自引:1,他引:1
刘华 《计算机工程与应用》2005,41(36):167-169
文章介绍了一个领域词语自动聚类的C#系统,系统以词和短语作为聚类对象,在分类系统的大规模语料库中,利用文本分类的特征提取方法进行词语的领域聚类,从而获得大规模的领域知识,用于主题分析。 相似文献
17.
针对已分割完成的啤酒瓶凸性字符,提出了一种基于圆周投影变换的图像特征提取方法。以质心为极点将笛卡尔坐标系变换为极坐标系,进行圆周投影计算,将二维的字符图像变换为一维投影。利用小波变换(WT)和离散余弦变换(DCT),提取不同字符的有效特征。通过相同、相似字符特征提取实验,表明该方法具有较好的抗噪声能力和分类性能。 相似文献
18.
在连续手写中文中,有偏旁部首离得较远的单字,单字之间可能会存在粘连、重叠。针对这种情况给出了一种基于识别得分提取单字的演化方法。对行笔划序列进行二进制编码,采用改进的遗传算法实现演化过程。染色体中连续0或1对应的笔划组成候选单字。用汉王手写单字识别器获取它们的识别得分,以单字个数较少和总的识别得分较大为优化目标。遗传算法中的变异概率和交叉概率自适应生成。测试结果表明该方法对连续手写中文具有较好的分割效果。 相似文献