首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
基于滴水算法的验证码中粘连字符分割方法   总被引:1,自引:0,他引:1  
众多研究表明,如果能将验证码中的字符分割开来,用现有的机器学习算法一般都能取得比较好的识别效果。针对字符粘连情况下的验证码的识别问题,提出了一种粘连字符的分割方法。该方法将字符的宽度统计值和竖直投影直方图中的投影极小值点相结合找到分割点,以这些分割点作为滴水算法的起始滴落点对粘连字符进行分割。实验结果证明,该方法用于分割验证码中的粘连字符具有一般性,能够提高验证码识别率。  相似文献   

2.
为了解决传统验证码识别方法效率低,精度差的问题,设计了一种先分割后识别的验证码处理方案。该方案在预处理阶段用中值滤波去噪,再利用霍夫变换对图像字符进行矫正;在字符分割阶段,利用垂直投影算法确定验证码字符块个数,以及字符坐标点,再用颜色填充算法对验证码进行初步分割,根据分割后的字符块数量对粘连字符进行二次分割;在识别阶段,我们对LeNet-5网络进行了改进,修改了输入层,并用全连接层替换了LeNet-5网络中的C5层,以此来对验证码字符进行识别;实验表明,对于非粘连验证码和粘连验证码,单张图片分割时间为0.14和0.15ms,分割准确率为98.75%和97.25%,识别准确率为99.99%和97.7%;结果表明,该算法对验证码分割和识别都有着很好的效果。  相似文献   

3.
验证码识别研究能及时发现验证码的安全漏洞,使其变得更加安全.扭曲粘连字符验证码能抵抗字符分割,是验证码识别中的难点.针对由扭曲粘连字符构成的验证码,提出一种基于密集尺度不变特征变换(DENSE SIFT)和随机抽样一致性算法(RANSAC)的识别方法.首先通过DENSE SIFT特征匹配获得匹配点集,再利用RANSAC算法获取匹配信息,最后采用队列式分析算法得出识别结果.实验表明,该方法对不同难度级别的扭曲粘连验证码均有较好的效果.  相似文献   

4.
在人机智能交互中,让机器自动识别验证码是机器模拟人的一项基础技术。基于文本的验证码识别一般先对验证码图片进行预处理,然后切割,最后对字符分类识别。字符切割的准确程度直接影响最终识别结果。提出一种对抗学习方法识别文本型验证码。先训练一个Pix2pix网络对验证码图片进行预处理,然后对抗训练出一对分割和识别网络。分割网络不仅能分割粘贴字符,而且可以筛选出难以分割的验证码结果。识别网络采用上下文相关的多通道卷积网络,能有效解决分割过程中因信息丢失而无法识别的问题。实验结果表明,该方法能提高文本验证码识别的准确率。  相似文献   

5.
验证码今已广泛应用在各个领域,常见的英文字母与数字组合的验证码自动识别准确率已达到较高的水准,而汉字因其字符复杂,用传统方法进行自动识别难度很大。提出一种基于卷积神经网络的验证码自动识别方法来提高字符的识别准确率。采用Keras卷积神经网络框架,设计多层卷积来提取深层次图像信息,分别对汉字验证码和字母数字验证码进行识别,以提高模型的泛化性。实验结果表明用该方法汉字验证码的单字识别率已达到99.4%;传统四字符字母数字验证码的识别率最高达到99.3%。这一结果表明深度神经网络对验证码复杂结构的感知能力很强大,通过对比实验发现Keras框架在验证码识别领域有较好效果。  相似文献   

6.
一种基于前端预测识别的粘连字符分割方法   总被引:9,自引:0,他引:9  
在字符识别领域,对粘连字符的识别是一个被广泛关注的技术难点,未能准确分割粘连字符是产生识别错误的主要原因之一。在总结已有方法的特点及不足的基础上,提出了基于前端预测识别来分割粘连字符的方法。首先根据粘连字符图像的特征初步确定前端字符的候选字符集,并通过验证候选字符与前端字符图像匹配的必要条件进一步对其筛选,然后使用候选字符的屏蔽码自适应地提取前端字符图像,最后由分类器对提取结果加以验证,达到分割和识别粘连字符的目的。该方法可以适应多种类型的粘连字符,准确性高,且在字符图像质量较差时具有较强的鲁棒性。  相似文献   

7.
为了有效地识别粘连字符,提出了旋转投影不变矩方法,此方法首先把字符串旋转到水平方向,然后采用最大方差阈值法把字符串从图像中提取出来,再沿垂直方向对字符串进行投影,投影图的波谷位置就是字符的切割位置,最后求取分割字符的旋转投影不变矩,利用旋转投影不变矩就可以对字符进行识别了,实验证明此方法是一种有效地粘连字符识别方法。  相似文献   

8.
验证码作为互联网安全措施的一道屏障,主要用于简单高效地辨别操作者是自然人还是机器人,防止恶意访问.利用某高校教务系统的字符图形验证码作为研究对象,通过对字符图像预处理后,采用投影法切割的方法提取字符,再利用支持向量机算法训练和识别.实验结果表明,采用支持向量机算法能够有效识别简单字符图形验证码.  相似文献   

9.
笔者利用OCR算法引擎Tesseract的样本训练方法,对简单验证码和复杂验证码进行识别。使用预处理后的单字符图片作为训练样本,对算法进行样本训练,以提高算法对普通字符验证码的识别率,并且使其可以识别较为复杂的字符验证码。实验结果证明,样本训练后的算法对简单验证码的识别率达到了99%以上,且可以对原本几乎无法识别的复杂验证码进行有效识别。  相似文献   

10.
为克服粘连字符对芯片字符识别的影响,提出一种基于改进滴水算法的粘连字符分割方法。在芯片图像进行必要的预处理后,提取单张芯片的标准字符信息,利用水平投影和连通域分析提取粘连区域。通过垂直投影和上下轮廓得到上下轮廓极值点;分别以粘连区域左右两端为起点,利用标准字符信息对极值点进行筛选,选取方差较小的一组作为候选分割点;通过分割点对应关系补齐遗漏的有效分割点;上下有效分割点分别作为水滴起始点和终止点,定义新的滴落路径对粘连字符进行分割。实验结果表明,该算法可有效解决芯片图像的字符粘连问题,并且在分割精准度上拥有良好的表现。  相似文献   

11.
基于权值模板和监督学习的验证码识别   总被引:1,自引:0,他引:1  
针对粘连字符分割致使验证码字符识别效果不佳的问题,提出一种带权值的模板匹配和基于监督学习的模板权值调整相结合的字符识别方法。该方法利用模板的灰度和权值,在验证码图像上搜寻兴趣点,再根据兴趣点的匹配度和兴趣点之间的欧式距离过滤掉次佳兴趣点,保留最佳兴趣点。利用基于目标像素个数期望的二值化阈值迭代优化,提高二值化质量和基于有监督的Hebb规则的模板权值学习提高识别率。通过与简单的模板匹配识别方法比较,实验结果表明,该方法对多网站验证码具有很好的识别率。  相似文献   

12.
A CAPTCHA is a test designed to distinguish computer programs from human beings, in order to prevent the abuse of networked resources. Academic research into CAPTCHAs includes designing friendly and secure CAPTCHA systems and defeating existing CAPTCHA systems. Traditionally, defeating a CAPTCHA test requires two procedures: segmentation and recognition. Recent research shows that the problem of segmentation is much harder than recognition. In this paper, two new segmentation techniques called projection and middle-axis point separation are proposed for CAPTCHAs with line cluttering and character warping. Experimental results show the proposed techniques can achieve segmentation rates of about 75%.  相似文献   

13.
陈令 《信息网络安全》2012,(6):26-28,43
文章根据一类图片验证码的字符颜色、大小、字符间位置关系,使用粗糙集的方法将验证码图片中的字符分割出来,再使用AdaBoost算法进行训练,将分割得到的字符识别出来。经实验证明,该算法对该类彩色验证码,无需很高的训练样本,即具有很高的识别率和速率,基本可以满足实时应用、、  相似文献   

14.
印刷维吾尔文本切割   总被引:1,自引:0,他引:1  
我国新疆地区使用的维吾尔文借用阿拉伯文字母书写。因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难。本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分。然后定位单词基线位置,计算单词轮廓和基线的距离,寻找所有可能的切点实现维文单词过切割,最后利用规则合并过切分字符。实验结果表明,字符切割准确率达到99 %以上。  相似文献   

15.
针对票据中字符之间的互相交错粘连,在总结与比较了以往的字符分割方法的基础上,提出了一种基于snake模型的交错字符分割方法。此方法首先根据传统的分割方法找出字符的候选分割位置,然后根据snake模型进行不规则、动态、曲线的分割,速度快且有较好的鲁棒性。  相似文献   

16.
Merged characters are the major cause of recognition errors. We classify the merging relationship between two involved characters into three types: "linear," "nonlinear," and "overlapped." Most segmentation methods handle the first type well, however, their capabilities of handling the other two types are limited. The weakness of handling the nonlinear and overlapped types results from character segmentation by linear, usually vertical, cuts assumed in these methods. This paper proposes a novel merged character segmentation and recognition method based on forepart prediction, necessity-sufficiency matching and character-adaptive masking. This method utilizes the information obtained from the forepart of merged characters to predict candidates for the leftmost character, and then applies character-adaptive masking and character recognition to verifying the prediction. Therefore, the arbitrary-shaped cutting path will follow the right shape of the leftmost character so as to preserve the shape of the next character. This method handles the first two types well and greatly improves the segmentation accuracy of the overlapped type. The experimental results and the performance comparisons with other methods demonstrate the effectiveness of the proposed method.  相似文献   

17.
在字符识别系统中,字符的有效分割是识别的关键。针对手写汉字字间距及字内距无规则可循,字符间极易发生粘连、交错等现象,提出一种多步分割方法。该方法首先利用Viterbi算法将原字符串切分成互不连通的分割块,使非粘连汉字、交错汉字得到正确分割;对于其中宽度较大存在粘连字符的分割块,从候选分割点入手,用非线性分割路径将粘连部分分开;最后再应用A*算法找到全局最佳分割位置,使过分割的字符得到完整合并。实验结果表明,该方法对于手写汉字的分割是可行、有效的。  相似文献   

18.
基于组件合并的手写体汉字串分割   总被引:5,自引:0,他引:5  
吕岳  施鹏飞  张克华 《软件学报》2000,11(11):1554-1559
人们对孤立的手写体汉字字符的离线 识别做了大量的研究工作,而走向实用化的进展并不快.除了单字识别率不理想以外,从文本 中正确分割出单个汉字字符也是一个主要难题,因为字符的识别离不开正确分割.利用汉字的 基本结构特征,根据两个组件之间的上下、左右和包围关系,对组件进行合并形成完整的汉字 图像.对整个汉字字符串中组件的宽度和相邻组件的间距进行分析,有助于左右关系组件的合 并.实验结果表明,该方法对手写体汉字字符串具有理想的分割效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号