首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
以统计模式识别的理论为指导,在联机识别手定汉字的粗分类过程中,提出直接对联机笔迹坐标序列操作,进行数据的处理,然后提取笔划的统计特征作为粗分类的依据,用K均值聚类方法进行聚类,生成分类树。通过对100套3755样本50类别数的测试,正确分类率达到96%,平均粗分类时间为每字0.03秒,平均匹配字数为623字,取得了较为满意的粗分类结果。  相似文献   

2.
汉字识别中正确识别率与识别速度的探讨   总被引:1,自引:0,他引:1  
本文把汉字识别归结为无记忆信道对离散信源的信息传输模型。由此出发导出了正确识别率、识别速度的计算公式,分析了影响正确识别率和识别速度的各种因素。给出了正确识别率与被识别字域大小的关系曲线。曲线表明,出现概率越大的汉字对正确识别率的贡献也越大。在汉字综合频度表的6763个汉字中,出现概率大的前4081个汉字对正确识别率的贡献为99.9%,而余下的2682个汉字对正确识别率的贡献仅仅为0.1%。 文中还对提高识别速度的途径进行了探讨,并作了模拟实验,给出了具有启示性的实验结果。  相似文献   

3.
本文以字符在各象限的端点数和转动惯量为识别特征,并利用邻类兼容和多级分类来识别印刷体字符。这种方法具有较强的区分相似字符的能力。本方法在C-4500数字图象处理机和FELIX-C512电子计算机组成的系统上做了实验,对6000个印刷体汉字的识别取得了令人满意的结果。  相似文献   

4.
支持向量机(SVM)最初是用以解决两类分类问题,不能直接用于多类分类,如何有效地将其推广到多类分类问题是一个正在研究的问题。该文总结了现有主要的支持向量机多类分类算法,分析比较了各算法的分类精度,同时对其中一类方法进行了改进。最后,把本文方法用于辐射源识别问题的解决,实际仿真结果表明该方法是有效的。  相似文献   

5.
一种基于支持向量机的手写汉字识别方法   总被引:30,自引:0,他引:30       下载免费PDF全文
本文提出了一种新的基于支持向量机手写汉字识别方法.支持向量机作为一种新的机器学习方法,由于其建立在结构风险最小化准则之上,而不是仅仅使经验风险达到最小,从而使得支持向量分类器具有较好的推广能力.本文首先讨论了支持向量机的基本原理,然后,针对支持向量机识别大类别手写汉字所遇到的特殊问题,文章进行了分析和阐述,并在此基础上,提出了基于最小距离分类器预分类的两级分类策略.最后,针对GB2312-80的1034个汉字类别的120套手写样本,进行了实验仿真.实验结果表明,本文方法的汉字识别率较距离分类器有较大提高,其中多项式核函数的支持向量分类器,识别率平均提高3.38%,表明了本文方法的有效性.  相似文献   

6.
实验性6763个印刷体汉字识别系统   总被引:1,自引:1,他引:0  
本文提出一种识别国标两级(6763个)印刷体汉字的新方法。根据汉字的结构,定义了一组结构特征(边框特征、局部特征和笔划端结点),作为预分类和匹配、识别的依据。 建立了一个识别6763个汉字的实验系统。实验结果表明,系统具有较高的抗干扰能力,正确识别率优于98%。  相似文献   

7.
一种基于笔划特征的印刷体汉字识别方法   总被引:1,自引:0,他引:1  
本文根据汉字的结构特点,以组成汉字的基本结构——笔划作为识别的基本单元,提出了笔划区域编码的分类方法和利用笔划有序四元组的识别方案,这种方法具有较强的分类能力和抗噪声能力。利用由FX-3300传真机、IBM-PC和TS-84图象显示系统所组成的汉字识别实验系统,对3,755个仿宋体印刷汉字进行多次现场识别,取得了较好的结果。  相似文献   

8.
为了高效地从视频中检索出激动人心的场面,提出了一种基于高斯混合模型的无监督情感场景检测方法.首先,从面部选取42个特征点,并定义10种面部特征;然后,利用高斯混合模型将视频的帧划分为多个聚类;最后,利用每一帧的面部表情分类结果将情感场景划分为单个聚类,并通过场景集成和删除完成检测.在生活记录视频和MMI人脸表情数据库上的实验结果表明,该方法的检测率、分类率分别高达98%,95%,检测5分钟左右的情感场景视频仅需0.138 s,性能优于几种较为先进的检测方法.  相似文献   

9.
为了精确地寻找活动形状模型中特征点的新位置,提出了一种基于支持向量机分类器的活动形状模型用于人脸特征点定位,即把寻找特征点新位置的任务转化为分类问题.起初,这是典型的两类分类问题,但两类分类器寻找特征点新位置效果并不理想.因此进一步提出把两类分类问题转化为多类分类问题.为每一个特征点训练一个支持向量机多类分类器,并用此分类器寻找该特征点新位置.实验结果表明,基于支持向量机多类分类器的活动形状模型比原始活动形状模型更为精确,稳健.  相似文献   

10.
针对大规模的高光谱数据分类,为了利用未标签样本所含信息,来提升分类器性能,提出了一种半监督分类算法。该算法根据聚类假设,即属于同一类地物的样本点在聚类中被分为同一类的可能性较大的原则来改进核函数,采用基于光谱角度量的K均值聚类算法对样本集进行聚类,根据多次聚类的结果,构造包袋核函数,然后利用加法和乘法运算将包袋核函数和RBF核函数组合成新的核函数,从而把未标签样本信息融入分类器。而且采用最小二乘支持向量机,将标准支持向量机的二次规划问题转换为求解线性方程组的问题。高光谱实测数据实验表明了本文方法的优越性。   相似文献   

11.
一种基于集成BP网络的手写汉字识别方法   总被引:6,自引:3,他引:3  
针对脱机手写体汉字识别,文章给出了一种基于多层BP网络的并行集成方法,该方法是纯神经网络的多分类器并行集成方案。汉字经预处理后,采用弹性网格变换和Zernike矩分别对汉字进行局部和全局特征提取,利用两个BP网络分类器对这两种特征进行训练和初分类。再利用集成网络对前两个子网络的识别结果进行识别。同时对BP网络的应用做了有益的探索,也为BP网络在人类别分类问题中的应用提供了一条可行的途径。实验结果验证了此方法的有效性。  相似文献   

12.
马田系统是一种多元系统定量模式识别方法,是数据分类的有效方法,在很多领域都得到广泛应用。构建正常样本数据的基准空间、筛选出有效的项目、确定阈值等是经典马田系统的重要步骤。文章改进马田系统中筛选有效项目的方法,经典马田系统将正交表和信噪比结合起来筛选有效项目;基于FCM聚类算法的马田系统尝试用FCM聚类算法选择有效项目,正交表的每一行作为一个实验方案,对于每种方案,都利用FCM进行聚类,得到样品分类的正确率。把正确率的信噪比作为筛选有效项目的指标,信噪比越大则选择的有效项目越可信。得到有效的检测项目之后,可以优化马田系统的基准空间,提高样品分类的正确率。  相似文献   

13.
支持向量机逐渐成为机器学习的一种方法。异常值检测是支持向量机中一种特殊的分类问题,被称为一类分类。一类分类通过核映射确定一个包含正类样本的紧致区域,以便使异常值更容易暴露出来。介绍了一些一类分类算法的基本思想。  相似文献   

14.
随着现代体育不断发展,奥运会承办比赛种类越 来越繁杂,对赛事视频分类提出了一 个新的挑战。现有的人工分类方法无法有效地区分团体竞技类比赛(球类)和个人竞技类比 赛(田径类)视频,从而进行大规模自动分类存储。然而,为了有效地重复使用这些视频文 件,需要对其进行分类存储,主要目的在于提高资源的利用率。针对人工分类手段太过于低 效的现状,本文对奥运会运动视屏内容分类问题进行研究,并提出了一种基于关键帧特征提 取和支持向量机(Supported Vector Machine,SVM)的视频分类方法。以第31届奥运会的 体育视频作为数据集,对每个视频进行关键帧提取和总结,并借由拉格朗日-高斯变换来计 算视频对应的特征向量,将特征向量作为SVM分类器的输入进行体育视频分类。实验结果表 明,对于任意奥运视频,提出的方法平均能够取得70%以上的正确分类率,而错误分类的比 例始终低于10%。特别地,对于奥运中的射击类视频,平均正确分类 率接近90%左右,说明了提出方法的有效性。  相似文献   

15.
在传统的虹膜识别系统中,虹膜匹配被认为是一个二分类问题:类内匹配和类间匹配。许多已存在的方法简单地利用距离来执行虹膜匹配。由于这些方法不能很好地利用虹膜特征,所以会产生很高的拒识率和误识率,且鲁棒性不强。为了解决这些问题,提出把虹膜匹配当作一个多分类问题,采用一种新颖的蕨算法(Ferns)分类器来完成该工作。相比支持向量机(SVM)分类器,在执行虹膜匹配时,Ferns分类器有诸多优点。为了对提出的算法给出全面评价,实验中分别在认证和识别这2种模式下对该算法进行测试。实验结果证明,提出的方法可以极大地改善虹膜识别系统的性能。  相似文献   

16.
针对广义特征值中心支持向量机(GEPSVM)训练和决策过程不一致问题,该文提出一类改进的基于特征值分解的中心支持向量机,简称为IGEPSVM。首先针对二分类问题提出了基于特征值分解的中心支持向量机,然后基于一类对余类策略将其推广到多类分类问题。将GEPSVM求解广义特征值问题转化为求解标准特征值问题,降低了计算复杂度。引入了一个新的参数,可以调节模型的性能,提高了GEPSVM的分类精度。提出了基于IGEPSVM的多类分类算法。实验结果表明,与GEPSVM算法相比较,IGEPSVM不仅提高了分类精度,而且缩短了训练时间。  相似文献   

17.
张维  杜兰 《电子与信息学报》2021,43(5):1219-1227
一类分类是一种将目标类样本和其他所有的非目标类样本区分开的分类方法。传统的一类分类方法针对所有训练样本建立一个分类器,忽视了数据的内在结构,在样本分布复杂时,其分类性能会严重下降。为了提升复杂分布情况下的分类性能,该文提出一种集成式Beta过程最大间隔一类方法。该方法利用Dirichlet过程混合模型(DPM)对训练样本聚类,同时在每一个聚类学习一个Beta过程最大间隔一类分类器。通过多个分类器的集成,可以构造出一个描述能力更强的分类器,提升复杂分布下的分类效果。DPM聚类模型和Beta过程最大间隔一类分类器在同一个贝叶斯框架下联合优化,保证了每一个聚类样本的可分性。此外,在Beta过程最大间隔一类分类器中,加入了服从Beta过程先验分布的特征选择因子,从而可以降低特征冗余度以及提升分类效果。基于仿真数据、公共数据集和实测SAR图像数据的实验结果证明了所提方法的有效性。  相似文献   

18.
王沙飞  杨俊安  温志津 《信号处理》2014,30(12):1443-1449
近年来,半监督学习在模式识别和机器学习领域引起了广泛关注。在这些方法中,半监督支持向量机是非常主流的一类方法。然而,学习过程中热核函数的参数选择问题一直困扰着研究人员,若选取不当,学习性能会显著下降。为了解决该问题,本文提出一种新颖的基于局部行为搜索策略的半监督学习算法。新算法基于人类行为搜索策略,传统的支持向量机被正则化为拉普拉斯图。在搜索到特征空间的局部分布后,行为因子能够映射到样本邻域的潜在概率分布。为验证新算法有效性,本文分别进行了UCI数据集和实际通信辐射源特征数据集实验。实验结果显示与传统方法相比,新算法的分类结果能够更加有效和稳定。   相似文献   

19.
在One‐Class基础上发展起来的超球支持向量机算法能有效地解决多类别分类问题。但是原始的超球支持向量机算法仍有很多需要改进的地方。经过推导和实验,得到如下结论,即超球支持向量机算法过度依赖于每个训练样本,即使该训练样本为噪音数据或是离群异常数据。因此提出在训练之前加入预处理算法,通过相似度计算删除噪音点和异常点。在训练过程中,根据公式计算每个样本的权值,区别对待每个训练样本,确保SMO求解过程迅速收敛。在测试阶段,根据测试点的位置合理选择分类规则进行正确分类。实验结果表明提出的算法可以有效减少噪音数据和异常数据对分类结果的影响,同时提高了分类精度。  相似文献   

20.
张维  杜兰 《电子与信息学报》2022,43(5):1219-1227
一类分类是一种将目标类样本和其他所有的非目标类样本区分开的分类方法.传统的一类分类方法针对所有训练样本建立一个分类器,忽视了数据的内在结构,在样本分布复杂时,其分类性能会严重下降.为了提升复杂分布情况下的分类性能,该文提出一种集成式Beta过程最大间隔一类方法.该方法利用Dirichlet过程混合模型(DPM)对训练样本聚类,同时在每一个聚类学习一个Beta过程最大间隔一类分类器.通过多个分类器的集成,可以构造出一个描述能力更强的分类器,提升复杂分布下的分类效果.DPM聚类模型和Beta过程最大间隔一类分类器在同一个贝叶斯框架下联合优化,保证了每一个聚类样本的可分性.此外,在Beta过程最大间隔一类分类器中,加入了服从Beta过程先验分布的特征选择因子,从而可以降低特征冗余度以及提升分类效果.基于仿真数据、公共数据集和实测SAR图像数据的实验结果证明了所提方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号