首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于凸包像素比特征的粘连汉字切分   总被引:4,自引:0,他引:4  
汉字切分正确与否直接影响了汉字识别系统的识别率,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集,并针对其中切分路径选择问题,提出了一种新特征- 凸包像素比,反映了在不同切分路径下汉字结构变化的特性。实验结果表明该特征对多种分类器均能有效地提高切分路径选择的正确率。其中在使用基于高斯混合模型分类器时取得了8816 %正确率。  相似文献   

2.
基于支持向量机的汉语歧义切分算法   总被引:1,自引:0,他引:1  
李蓉 《计算机仿真》2009,26(7):354-357
针对于解决交集型伪歧义字段的切分,提出了一种应用支持向量机的汉语歧义切分方法.歧义切分问题可看为一个模式分类问题,为提高字段处理能力,应用支持向量机方法建立分类模型.先对歧义字段进行特征提取,采用互信息来表示歧义字段.求解过程是一个有教师学习过程,从歧义字段中挑选出一些高频伪歧义字段,人工将其正确切分作为训练样本并代入SVM训练得到一个分类模型.在分类阶段将SVM和KNN相结合构造一个新的分类器,对于待识别歧义字段代入分类器即可得到切分结果.实验证明不仅具有一定的识别准确率,而且可以提高歧义切分速度.  相似文献   

3.
粘连断裂字符行的切分识别,是很多OCR 实际应用中存在的主要困难之一. 本文针对粘连断裂的印刷体数字行,提出了一种基于Viterbi 算法的切分识别方案,该方案采用两次切分识别的层次型结构. 在第二次切分识别过程中,首先,在候选切分点区域,结合灰度图像与二值轮廓信息,采用基于Viterbi 算法搜索的非直线路径进行切分,得到有效的切分路径;然后,结合分类器输出的可信度,采用Viterbi 算法来合并前面得到的候选切分图像块,进行动态切分与识别. 实际的金融票据识别系统实验表明,本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况,提高了识别系统的识别率和鲁棒性.  相似文献   

4.
针对在物体外观快速变化的情况下,大多数弱学习器不能捕获物体新的特征分布,导致追踪失败的问题,提出了高斯加权的联机多分类器增强算法。该算法为每一个领域问题定义一个弱分类器,每个弱分类器包括一个简单的视觉特征和阈值,引入高斯加权函数来权衡每个弱分类器在特定样本上的贡献,通过多分类器联合学习来提高追踪性能。在物体追踪过程中,联机多分类器在对物体定位的同时还能估计物体的姿态,能够成功地学习多模态外观模型,在物体外观快速变化的情况下追踪物体。实验结果表明:所提算法在经过一个较短序列的训练后,平均追踪错误率为12.8%,追踪性能明显提升。  相似文献   

5.
研究了一种有效的词典驱动的联机手写日文病名识别方法。病名词典以树结构存储,包含21 713个病名短语。在切分中,手写病名字符串通过分析相邻笔划之间的空间信息等特征被切分为原始的片段序列。连续的片段动态地合并为候选字符模式,不同的合并方式产生不同的候选字符序列,这样可构成一个切分候选网格。在识别过程中,结合病名词典匹配来限制候选字符模式的类别扩展,采用集束搜索策略来寻找到一条最优路径作为识别结果。用500个实际的手写病名样本做实验,平均每个病名的识别时间为0.87 s,识别正确率为83.16%。  相似文献   

6.
本文介绍了贝叶斯(Bayes)决策理论和模式识别的过程,并用Bayes分类算法设计了一个图像分类器。该分类器通过对各个类别的后验概率的计算.对0-9这十类联机手写数字进行识别实验。  相似文献   

7.
针对中文联机手写文本识别中需要对不同长度的切分路径进行快速合理评价的问题,提出了一种基于后验概率的动态规划代价函数计算方法,结合切分块与切分点的几何信息,利用原始切分块的个数对代价值进行加权。实验证明,该方法有效克服了不同路径长度的负面影响,提高了最优切分路径搜索的准确率。  相似文献   

8.
基于贝叶斯分类器的混排文字切分与分类   总被引:2,自引:1,他引:2  
该文针对实际的混排文档图像,提出一种基于贝叶斯分类器的统计学习方法切分文字,并实现文字类别判断。该方法结构简单、计算量少、易于扩展功能,而且试验结果表明该方法切分效果好、文字类别判断准确。  相似文献   

9.
提出了一种联机英文手写单词分割的方法。该方法的基本过程是通过确定单词的主笔划找到单词的中线,再根据中线以上的部分过拆分单词,最后对过拆分的切分段进行合并得到单词的多个候选结果。该文的实验基于unipen训练集和测试集,实验结果表明该文分割方案具有有效性和可行性。  相似文献   

10.
提出了一种联机英文手写单词分割的方法。该方法的基本过程是通过确定单词的主笔划找到单词的中线,再根据中线以上的部分过拆分单词,最后对过拆分的切分段进行合并得到单词的多个候选结果。该文的实验基于unipen训练集和测试集,实验结果表明该文分割方案具有有效性和可行性。  相似文献   

11.
文章提出了一种应用人工神经网络进行入侵检测分类器设计的新方法,即采用多层前向网络的交叉覆盖算法进行入侵检测分类器的设计。该算法克服了传统BP算法的收敛速度慢,易陷入局部最小点的问题。实验结果表明,该分类器用于入侵检测,效果良好,学习速度快,分类准确率高,为实现入侵检测分类器提供了一条准确高效的途径。  相似文献   

12.
In this paper we study heart arrhythmia classification for single chamber implantable cardio-verter defibrillators. Our research shows that performance of conventional classification methods using only simple heart rate timing based features can be improved with the inclusion of morphology analysis on samples of the right ventricular apex lead. While morphology classification is typically patient dependent, and computationally expensive, we show that the performance of a patient independent classifier which uses a multi-layer perceptron for morphology recognition and heart beat timing decision tree is superior to that of a timing only classifier, while remaining economical (silicon area and power dissipation) from an implementation perspective. We also show that performance can be significantly improved in the patient dependent case.  相似文献   

13.
We analyze classification problems in which data is generated by a two-tiered random process. The class is generated first, then a layer of conditionally independent hidden variables, and finally the observed variables. For sources like this, the Bayes-optimal rule for predicting the class given the values of the observed variables is a two-layer neural network. We show that, if the hidden variables have non-negligible effects on many observed variables, a linear classifier approximates the error rate of the Bayes optimal classifier up to lower order terms. We also show that the hinge loss of a linear classifier is not much more than the Bayes error rate, which implies that an accurate linear classifier can be found efficiently.  相似文献   

14.
多层感知器的一种快速网络训练法及其应用   总被引:7,自引:0,他引:7  
宋宜斌 《控制与决策》2000,15(1):125-127
从多层感知器原理分析出发,提出一种自适应学习速率因子方法,用于对多层感知器中BP算法的改进,并将改进算法用于XOR问题的学习及某分类器实例样本的学习。仿真结果表明,改进的BP算法可显著加速网络训练速度,学习过程具有较好的收敛性和较强的鲁棒性。  相似文献   

15.
基于DCT和神经网络的人脸识别   总被引:4,自引:0,他引:4  
人脸识别是模式识别领域的一个具有挑战性的课题,并且有着潜在的应用前景。该文提出了基于DCT和神经网络的人脸识别方法,针对人脸图像分别提取整体和局部的DCT系数共同送入多层感知机分类器分类,实验表明所提出的方法具有识别速度快、识别率较高的综合优势。  相似文献   

16.
提出了一种利用多层BP神经网络建立进程正常运行轮廓的思想,基于1998年DARPA入侵检测系统评估的审计数据源,通过与K近邻分类、带(频率)门限的Stide(TStide)算法的性能比较表明,所提出的算法具有较高的检测率,同时维持了一个较低的误警率。  相似文献   

17.
AdaBoost是机器学习中比较流行的分类算法.通过研究弱分类器的特性,提出了两种新的弱分类器的阈值和偏置计算方法,二者可以使弱分类器识别率大于50%,从而保证在弱分类器达到一定数目的情况下,AdaBoost训练收敛.对两种阈值和偏置计算方法的仿真实验结果表明,在错分率降可接受的范围内,二者均使用较少的弱分类器便可获得高识别率的强分类器.  相似文献   

18.
We formalize the notion of style context, which accounts for the increased accuracy of the field classifiers reported in this journal recently. We argue that style context forms the basis of all order-independent field classification schemes. We distinguish between intraclass style, which underlies most adaptive classifiers, and interclass style, which is a manifestation of interpattern dependence between the features of the patterns of a field. We show how style-constrained classifiers can be optimized either for field error (useful for short fields like zip codes) or for singlet error (for long fields, like business letters). We derive bounds on the reduction of error rate with field length and show that the error rate of the optimal style-constrained field classifier converges asymptotically to the error rate of a style-aware Bayesian singlet classifier.  相似文献   

19.
Detection of recognition errors is important in many areas, such as improving recognition performance, saving manual effort for proof-reading and post-editing, and assigning appropriate weights for retrieval in constructing digital libraries. We propose a novel application of multiple classifiers for the detection of recognition errors. A need for multiple classifiers emerges when a single classifier cannot improve recognition-error detection performance compared with the current detection scheme using a simple threshold mechanism. Although the single classifier does not improve recognition error performance, it serves as a baseline for comparison and the related study of useful features for error detection suggests three distinct cases where improvement is needed. For each case, the multiple classifier approach assigns a classifier to detect the presence or absence of errors and additional features are considered for each case. Our results show that the recall rate (70-80%) of recognition errors, the precision rate (80-90%) of recognition error detection and the saving in manual effort (75%) were better than the corresponding performance using a single classifier or a simple threshold detection scheme.  相似文献   

20.
多类指数损失函数逐步添加模型(SAMME)是一种多分类的AdaBoost算法,为进一步提升SAMME算法的性能,针对使用加权概率和伪损失对算法的影响进行研究,在此基础上提出了一种基于基分类器对样本有效邻域分类的动态加权AdaBoost算法SAMME.RD。首先,确定是否使用加权概率和伪损失;然后,求出待测样本在训练集中的有效邻域;最后,根据基分类器针对有效邻域的分类结果确定基分类器的加权系数。使用UCI数据集进行验证,实验结果表明:使用真实的错误率计算基分类器加权系数效果更好;在数据类别较少且分布平衡时,使用真实概率进行基分类器筛选效果较好;在数据类别较多且分布不平衡时,使用加权概率进行基分类器筛选效果较好。所提的SAMME.RD算法可以有效提高多分类AdaBoost算法的分类正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号