共查询到19条相似文献,搜索用时 423 毫秒
1.
2.
工程图的子连通域表示及其应用 总被引:1,自引:1,他引:0
文章介绍了基于子连通域表示的工程图处理方法,包括子连通域的概念、提取方法、操作和应用等。子连通域是连通域的一部分,从图象的子连通域表示出发,可以进行提取连通域、轮廓跟踪及旋转、缩放等操作,利用这些操作,可以方便地从点阵图象中提取线条、字符和分割粘连的字符。 相似文献
3.
4.
5.
建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Voronoi区域,形成连通成分之间的邻接关系;最后在贝叶斯框架下,基于相邻字符区域的高斯混合模型计算相应的伪概率,以此为判据将每个连通成分标注为字符或非字符.利用所提出的文本提取方法,进行了复杂中英文文本的提取实验,获得大于97%的准确率和大于80%的召回率,证实了方法的有效性. 相似文献
6.
基于人在字符串匹配过程中常用的思维,提出一种从模式串中提取特殊字符和具有特殊结构的字符组成字符串,用数组或链表来表示这种字符串的结构,使得提取出来的字符能与目标串中相应位置的字符比较的算法。用以减少比较次数,提高匹配效率。 相似文献
7.
针对以往车牌字符分割算法在复杂情况下分割准确率低的问题,提出了一种基于新邻域模板的连通域算法的车牌字符分割算法。采用基于新模板的连通域算法粗分割字符;通过自适应阈值投影法进行字符细分割;同时使用区域合并算法保证字符的完整性。实验结果表明,该算法将连通域法与投影法有效结合,能够同时解决汉字不连通、字符粘连和边框粘连等复杂情况,该算法对车牌字符进行分割正确率达99.5%。 相似文献
8.
车牌字符分割是车牌识别系统的三大关键技术之一.为了准确地进行字符分割,提高字符识别的准确率和识别的速度,提出了一种改进的连通域提取车牌字符分割算法,算法通过扫描目标像素的若干相邻像素后按照一定的准则确定目标像素与相邻像素之间的连通关系,可克服同类算法中像素重复标记和归并标记需大量运算的缺陷,最后得到正确的连通标记划分并能提取出各个分离的连通区域.实验表明算法能够准确快速地识别字符,且具有较好的稳健性. 相似文献
9.
针对食品包装行业中喷墨打印技术形成的点阵字符不连续及食品包装背景复杂等问题,提出一种基于改进的连通域分割与BP神经网络相结合的字符识别方法.利用数学形态学与连通域分析定位点阵字符区域,对字符区域进行分割,利用BP神经网络对字符进行识别.实验结果表明,该方法在字符分割和识别上的效果均有较大的提升,其字符识别准确率达到98.03%. 相似文献
10.
TH—DAIMS3.0清华图纸自动输入与管理系统 总被引:3,自引:0,他引:3
本文将围绕如何充分利用图纸图象的问题,介绍了TH-DAIMS3.0系统的设计目标、主要功能特点,以及系统中所采用的各种新技术。在TH-DAIMS3.0中,我们用自适应分块二值化技术提高消蓝支污能力,用连通域分类技术进行图文分离,用模式匹配技术识别工程图中的尺寸标注字符,用八方向连通域搜索技术及轮廓跟踪技术拾取曲线,用交互式分类矢量优技术进行矢量化处理,用光机矢量双向混合设计加速交互处理。文章的最后 相似文献
11.
12.
13.
Handprinted word recognition on a NIST data set 总被引:1,自引:0,他引:1
Paul Gader Michael Whalen Margaret Ganzberger Dan Hepp 《Machine Vision and Applications》1995,8(1):31-40
An approach to handprinted word recognition is described. The approach is based on the use of generating multiple possible segmentations of a word image into characters and matching these segmentations to a lexicon of candidate strings. The segmentation process uses a combination of connected component analysis and distance transform-based, connected character splitting. Neural networks are used to assign character confidence values to potential character within word images. Experimental results are provided for both character and word recognition modules on data extracted from the NIST handprinted character database. 相似文献
14.
15.
孙桂煌 《电脑与微电子技术》2011,(14):9-11,16
由于文本自身特点使得传统的文档表示模型VSM不能很好地反映文本信息.也让传统数据挖掘聚类算法得不到很好的性能表现。针对传统文本聚类方法中文本表示模型VSM和聚类算法的不足,提出一种基于n—gram短语的文本聚类方法,该方法利用n-gram短语构建短语文档相关模型,将其转换成相关文档模型,在相关文档模型基础上进行文档聚类。实验结果显示,此方法是一种能获得较好聚类结果的有效方法。 相似文献
16.
由于文本自身特点使得传统的文档表示模型VSM不能很好地反映文本信息,也让传统数据挖掘聚类算法得不到很好的性能表现。针对传统文本聚类方法中文本表示模型VSM和聚类算法的不足,提出一种基于n-gram短语的文本聚类方法,该方法利用n-gram短语构建短语文档相关模型,将其转换成相关文档模型,在相关文档模型基础上进行文档聚类。实验结果显示,此方法是一种能获得较好聚类结果的有效方法。摘要: 相似文献
17.
18.
文本分类是信息检索和数据挖掘的基础,被广泛应用于网络数据挖掘及搜索引擎等方面。首先对文本进行分词,对分词的结果分别使用x2统计量(CHI)方法与相关系数法(CC法)进行降维,并使用维数调节的思想进行特征提取。在得到特征集后,使用覆盖算法作为文本分类器进行学习。实验结果表明,通过结合相关系数法、覆盖算法以及维数调节方法,可实现一个效果较好的文本分类器。 相似文献
19.
Fletcher L.A. Kasturi R. 《IEEE transactions on pattern analysis and machine intelligence》1988,10(6):910-918
The development and implementation of an algorithm for automated text string separation that is relatively independent of changes in text font style and size and of string orientation are described. It is intended for use in an automated system for document analysis. The principal parts of the algorithm are the generation of connected components and the application of the Hough transform in order to group components into logical character strings that can then be separated from the graphics. The algorithm outputs two images, one containing text strings and the other graphics. These images can then be processed by suitable character recognition and graphics recognition systems. The performance of the algorithm, both in terms of its effectiveness and computational efficiency, was evaluated using several test images and showed superior performance compared to other techniques 相似文献