期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

魏湘辉马少平《中文信息学报》2005,19(1):92-98

汉字切分正确与否直接影响了汉字识别系统的识别率,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集,并针对其中切分路径选择问题,提出了一种新特征- 凸包像素比,反映了在不同切分路径下汉字结构变化的特性。实验结果表明该特征对多种分类器均能有效地提高切分路径选择的正确率。其中在使用基于高斯混合模型分类器时取得了8816 %正确率。相似文献

2.

基于支持向量机的汉语歧义切分算法 总被引：1，自引：0，他引：1

李蓉《计算机仿真》2009,26(7):354-357

针对于解决交集型伪歧义字段的切分,提出了一种应用支持向量机的汉语歧义切分方法.歧义切分问题可看为一个模式分类问题,为提高字段处理能力,应用支持向量机方法建立分类模型.先对歧义字段进行特征提取,采用互信息来表示歧义字段.求解过程是一个有教师学习过程,从歧义字段中挑选出一些高频伪歧义字段,人工将其正确切分作为训练样本并代入SVM训练得到一个分类模型.在分类阶段将SVM和KNN相结合构造一个新的分类器,对于待识别歧义字段代入分类器即可得到切分结果.实验证明不仅具有一定的识别准确率,而且可以提高歧义切分速度. 相似文献

3.

基于Viterbi 算法的粘连断裂印刷体数字行切分识别方法

殷绪成刘昌平《自动化学报》2007,33(3):315-322

粘连断裂字符行的切分识别，是很多OCR 实际应用中存在的主要困难之一. 本文针对粘连断裂的印刷体数字行，提出了一种基于Viterbi 算法的切分识别方案，该方案采用两次切分识别的层次型结构. 在第二次切分识别过程中，首先，在候选切分点区域，结合灰度图像与二值轮廓信息，采用基于Viterbi 算法搜索的非直线路径进行切分，得到有效的切分路径；然后，结合分类器输出的可信度，采用Viterbi 算法来合并前面得到的候选切分图像块，进行动态切分与识别. 实际的金融票据识别系统实验表明，本文提出的印刷体数字行切分识别方法能够较好的克服字符行的粘连与断裂情况，提高了识别系统的识别率和鲁棒性. 相似文献

4.

高斯加权的多分类器物体追踪

兰远东邓辉舫蔡昭权杨雄《计算机应用》2014,34(8):2394-2398

针对在物体外观快速变化的情况下,大多数弱学习器不能捕获物体新的特征分布,导致追踪失败的问题,提出了高斯加权的联机多分类器增强算法。该算法为每一个领域问题定义一个弱分类器,每个弱分类器包括一个简单的视觉特征和阈值,引入高斯加权函数来权衡每个弱分类器在特定样本上的贡献,通过多分类器联合学习来提高追踪性能。在物体追踪过程中,联机多分类器在对物体定位的同时还能估计物体的姿态,能够成功地学习多模态外观模型,在物体外观快速变化的情况下追踪物体。实验结果表明：所提算法在经过一个较短序列的训练后,平均追踪错误率为12.8%,追踪性能明显提升。相似文献

5.

词典驱动的联机手写日文病名识别研究

下载免费PDF全文

梁建娟朱碧兰刘本永中川正樹《计算机工程与应用》2010,46(20):116-118

研究了一种有效的词典驱动的联机手写日文病名识别方法。病名词典以树结构存储,包含21 713个病名短语。在切分中,手写病名字符串通过分析相邻笔划之间的空间信息等特征被切分为原始的片段序列。连续的片段动态地合并为候选字符模式,不同的合并方式产生不同的候选字符序列,这样可构成一个切分候选网格。在识别过程中,结合病名词典匹配来限制候选字符模式的类别扩展,采用集束搜索策略来寻找到一条最优路径作为识别结果。用500个实际的手写病名样本做实验,平均每个病名的识别时间为0.87 s,识别正确率为83.16%。相似文献

6.

基于Bayes决策的联机手写数字识别

王军王员云《福建电脑》2008,(3):94-95

本文介绍了贝叶斯（Bayes）决策理论和模式识别的过程,并用Bayes分类算法设计了一个图像分类器。该分类器通过对各个类别的后验概率的计算．对0-9这十类联机手写数字进行识别实验。相似文献

7.

基于统计的动态规划算法在联机汉字切分中的应用*

姚正斌丁晓青刘长松《计算机应用研究》2011,28(7):2592-2594

针对中文联机手写文本识别中需要对不同长度的切分路径进行快速合理评价的问题,提出了一种基于后验概率的动态规划代价函数计算方法,结合切分块与切分点的几何信息,利用原始切分块的个数对代价值进行加权。实验证明,该方法有效克服了不同路径长度的负面影响,提高了最优切分路径搜索的准确率。相似文献

8.

基于贝叶斯分类器的混排文字切分与分类 总被引：2，自引：1，他引：2

肖波徐蔚然《计算机工程与应用》2005,41(10):83-85

该文针对实际的混排文档图像,提出一种基于贝叶斯分类器的统计学习方法切分文字,并实现文字类别判断。该方法结构简单、计算量少、易于扩展功能,而且试验结果表明该方法切分效果好、文字类别判断准确。相似文献

9.

基于过拆分和合并的联机手写英文单词分割技术

赵道华艾斯卡尔·艾木都拉《数字社区&智能家居》2009,(7)

提出了一种联机英文手写单词分割的方法。该方法的基本过程是通过确定单词的主笔划找到单词的中线,再根据中线以上的部分过拆分单词,最后对过拆分的切分段进行合并得到单词的多个候选结果。该文的实验基于unipen训练集和测试集,实验结果表明该文分割方案具有有效性和可行性。相似文献

10.

基于过拆分和合并的联机手写英文单词分割技术

赵道华艾斯卡尔&#;艾木都拉《数字社区&智能家居》2009,5(3):1693-1695

提出了一种联机英文手写单词分割的方法。该方法的基本过程是通过确定单词的主笔划找到单词的中线,再根据中线以上的部分过拆分单词,最后对过拆分的切分段进行合并得到单词的多个候选结果。该文的实验基于unipen训练集和测试集,实验结果表明该文分割方案具有有效性和可行性。相似文献

11.

基于交叉覆盖算法的入侵检测

赵姝张燕平张媛陈传明《计算机工程与应用》2005,41(1):141-143

文章提出了一种应用人工神经网络进行入侵检测分类器设计的新方法,即采用多层前向网络的交叉覆盖算法进行入侵检测分类器的设计。该算法克服了传统BP算法的收敛速度慢,易陷入局部最小点的问题。实验结果表明,该分类器用于入侵检测,效果良好,学习速度快,分类准确率高,为实现入侵检测分类器提供了一条准确高效的途径。相似文献

12.

Classifier architectures for single chamber arrhythmia recognition

Marwan Jabri Edward Tinker 《Applied Intelligence》1996,6(3):215-224

In this paper we study heart arrhythmia classification for single chamber implantable cardio-verter defibrillators. Our research shows that performance of conventional classification methods using only simple heart rate timing based features can be improved with the inclusion of morphology analysis on samples of the right ventricular apex lead. While morphology classification is typically patient dependent, and computationally expensive, we show that the performance of a patient independent classifier which uses a multi-layer perceptron for morphology recognition and heart beat timing decision tree is superior to that of a timing only classifier, while remaining economical (silicon area and power dissipation) from an implementation perspective. We also show that performance can be significantly improved in the patient dependent case. 相似文献

13.

Linear classifiers are nearly optimal when hidden variables have diverse effects

Nader H. Bshouty Philip M. Long 《Machine Learning》2012,86(2):209-231

We analyze classification problems in which data is generated by a two-tiered random process. The class is generated first, then a layer of conditionally independent hidden variables, and finally the observed variables. For sources like this, the Bayes-optimal rule for predicting the class given the values of the observed variables is a two-layer neural network. We show that, if the hidden variables have non-negligible effects on many observed variables, a linear classifier approximates the error rate of the Bayes optimal classifier up to lower order terms. We also show that the hinge loss of a linear classifier is not much more than the Bayes error rate, which implies that an accurate linear classifier can be found efficiently. 相似文献

14.

多层感知器的一种快速网络训练法及其应用 总被引：7，自引：0，他引：7

宋宜斌《控制与决策》2000,15(1):125-127

从多层感知器原理分析出发,提出一种自适应学习速率因子方法,用于对多层感知器中ＢＰ算法的改进,并将改进算法用于ＸＯＲ问题的学习及某分类器实例样本的学习。仿真结果表明,改进的ＢＰ算法可显著加速网络训练速度,学习过程具有较好的收敛性和较强的鲁棒性。相似文献

15.

基于DCT和神经网络的人脸识别 总被引：4，自引：0，他引：4

方宁李景治贺贵明《计算机工程》2004,30(16):53-56

人脸识别是模式识别领域的一个具有挑战性的课题，并且有着潜在的应用前景。该文提出了基于DCT和神经网络的人脸识别方法，针对人脸图像分别提取整体和局部的DCT系数共同送入多层感知机分类器分类，实验表明所提出的方法具有识别速度快、识别率较高的综合优势。相似文献

16.

一种基于神经网络和系统调用的异常入侵检测方法

张义荣鲜明肖顺平王国玉《计算机应用研究》2006,23(9):119-121

提出了一种利用多层BP神经网络建立进程正常运行轮廓的思想,基于1998年DARPA入侵检测系统评估的审计数据源,通过与K近邻分类、带(频率)门限的Stide(TStide)算法的性能比较表明,所提出的算法具有较高的检测率,同时维持了一个较低的误警率。相似文献

17.

一种新的改进AdaBoost弱分类器训练算法

下载免费PDF全文

谢红跃方昱春蔡起运《中国图象图形学报》2009,14(11):2411-2415

AdaBoost是机器学习中比较流行的分类算法.通过研究弱分类器的特性,提出了两种新的弱分类器的阈值和偏置计算方法,二者可以使弱分类器识别率大于50%,从而保证在弱分类器达到一定数目的情况下,AdaBoost训练收敛.对两种阈值和偏置计算方法的仿真实验结果表明,在错分率降可接受的范围内,二者均使用较少的弱分类器便可获得高识别率的强分类器. 相似文献

18.

Analytical results on style-constrained bayesian classification of pattern fields

Veeramachaneni S Nagy G 《IEEE transactions on pattern analysis and machine intelligence》2007,29(7):1280-1285

We formalize the notion of style context, which accounts for the increased accuracy of the field classifiers reported in this journal recently. We argue that style context forms the basis of all order-independent field classification schemes. We distinguish between intraclass style, which underlies most adaptive classifiers, and interclass style, which is a manifestation of interpattern dependence between the features of the patterns of a field. We show how style-constrained classifiers can be optimized either for field error (useful for short fields like zip codes) or for singlet error (for long fields, like business letters). We derive bounds on the reduction of error rate with field length and show that the error rate of the optimal style-constrained field classifier converges asymptotically to the error rate of a style-aware Bayesian singlet classifier. 相似文献

19.

A multiple classifier approach to detect Chinese character recognition errors

K.-Y. Hung Author Vitae Author Vitae D.S. Yeung Author Vitae Author Vitae W. Shu Author Vitae 《Pattern recognition》2005,38(5):723-738

Detection of recognition errors is important in many areas, such as improving recognition performance, saving manual effort for proof-reading and post-editing, and assigning appropriate weights for retrieval in constructing digital libraries. We propose a novel application of multiple classifiers for the detection of recognition errors. A need for multiple classifiers emerges when a single classifier cannot improve recognition-error detection performance compared with the current detection scheme using a simple threshold mechanism. Although the single classifier does not improve recognition error performance, it serves as a baseline for comparison and the related study of useful features for error detection suggests three distinct cases where improvement is needed. For each case, the multiple classifier approach assigns a classifier to detect the presence or absence of errors and additional features are considered for each case. Our results show that the recall rate (70-80%) of recognition errors, the precision rate (80-90%) of recognition error detection and the saving in manual effort (75%) were better than the corresponding performance using a single classifier or a simple threshold detection scheme. 相似文献

20.

基于多类指数损失函数逐步添加模型的改进多分类AdaBoost算法

翟夕阳王晓丹雷蕾魏晓辉《计算机应用》2017,37(6):1692-1696

多类指数损失函数逐步添加模型（SAMME）是一种多分类的AdaBoost算法,为进一步提升SAMME算法的性能,针对使用加权概率和伪损失对算法的影响进行研究,在此基础上提出了一种基于基分类器对样本有效邻域分类的动态加权AdaBoost算法SAMME.RD。首先,确定是否使用加权概率和伪损失;然后,求出待测样本在训练集中的有效邻域;最后,根据基分类器针对有效邻域的分类结果确定基分类器的加权系数。使用UCI数据集进行验证,实验结果表明：使用真实的错误率计算基分类器加权系数效果更好;在数据类别较少且分布平衡时,使用真实概率进行基分类器筛选效果较好;在数据类别较多且分布不平衡时,使用加权概率进行基分类器筛选效果较好。所提的SAMME.RD算法可以有效提高多分类AdaBoost算法的分类正确率。相似文献