共查询到20条相似文献,搜索用时 31 毫秒
1.
本文应用非常适合军用多功能外设汉字识别的Melin变换方法进行特征抽取,并针对目前普遍采用的汉字识别中可分性准则函数的局限性,提出了一种适合军用多功能外设中印刷体汉字识别特点的可分性准则函数。使用此函数进行汉字特征选择能保证不同汉字的分类特征距离大且同一汉字的聚类性较好。实验证明,选用此可分性准则函数可以选择较少的汉字特征,并使识别率有较大地提高。 相似文献
2.
3.
《计算机应用与软件》2016,(7)
为有效地利用多特征融合技术提高手写体汉字识别系统信息容量,同时有效地控制数据规模,提出一种基于反馈调整机制的手写体汉字特征属性变精度自适应动态调整简约方法。依据粗糙集理论,建立以先验知识指导训练过程的手写体汉字识别决策信息系统,给出以系统识别容量熵作为判断条件的特征融合算法。基于类别可分性准则,定义变精度特征粗糙集的信息粒度熵,给出基于信息粒度熵的变精度特征简约算法。在规定修正粗糙度范围的基础上,设计出启发式反馈机制,运用粒子群算法动态调整β正确分类率,训练样本特征集合在历次循环过程中选择最佳约简特征集合。实验表明该方法大大减少了手写体汉字的特征属性维数,降低了信息系统决策规则的复杂度。 相似文献
4.
5.
手写汉字识别是实现办公室自动化的前沿课题,选择具有良好可分性的特征,是提高系统识别率的根本保证。本文提出汉字的横竖方向上笔划穿越次数投影的Rapid变换为统计特征,用汉字的四边及四角部位作为结构的特征,通过对40,000个汉字样本的实验,结果表明分类效果良好,可以用此方法做成一个汉字识别系统。 相似文献
6.
任意范数熵与特征抽取 总被引:2,自引:0,他引:2
文章概述了各种用于特征抽取的可分性准则的概况。介绍了按任意范数熵定义的可分性准则,分析并证明了这一准则的一些性质,同时介绍了一种定量比较各种准则的方法。按此方法对现有主要准则作了定量比较,计算结果说明任意范数下的熵准则是一种非常有效的可分性准则。 相似文献
7.
针对传统线性判别分析(LDA)的子空间倾向于保留大类间距离类对的可分性,而丢弃小类间距离类对的可分性的问题,基于子空间应均衡保留各类对可分性的思想,提出一种新的准则——散度比例(PD)准则。PD准则为各类对子空间散度与原空间散度之比的均值,并推导出最大化PD准则的线性判别分析(PD-LDA)的求解过程。采用PD-LDA对高分辨距离像(HRRP)的幅度谱进行特征提取,基于外场实测数据,分别训练了最小欧氏距离分类器和支持向量机(SVM)分类器,两种分类器的识别结果均表明,PD-LDA相比LDA,可显著降低数据维数并有效提高识别率。 相似文献
8.
对于自然场景中拍摄的汉字图像,现有的汉字识别算法出现了很多问题,如传统的BP神经网络算法识别效率低下,传统的RBF神经网络算法识别准确率不高等,针对这些问题,论文提出了融合K-means和RBF神经网络的汉字识别算法.该算法通过引入减聚类算法,来计算出K-means算法的初始聚类中心及其个数,接着用K-means算法计算出RBF神经网络算法的径向基函数的中心,最后确定径向基函数的宽度以及隐含层到输出层之间的权值.实验结果表明该算法有着较高的准确率,能有效地提高汉字识别效率,具有一定的实用价值. 相似文献
9.
基于最小代价的多分类器的动态集成 总被引:2,自引:0,他引:2
本文提出一种基于最小代价准则的分类器动态集成方法。与一般方法不同,动态集成是 根据“性能预测特征”,动态地为每一样本选择最适合的一组分类器进行集成。该选择基于使误识代价与时间代价最小化的准则,改变代价函数的定义可以方便地达到识别率与识别速度之间的不同折衷。本文中提出了两种分类器动态集成的方法,并介绍了在联机手写汉字识别中的具体应用。在实验中使了3个分类器进行动态集成,因此,得到7种分类组合,在预先 相似文献
10.
随着计算能力的飞速增长、训练数据的不断积累以及非线性激活函数的不断完善,卷积神经网络(CNN)在手写体汉字识别中表现出较好的识别性能。针对CNN识别手写体汉字识别速度慢的问题,将二维主成分分析(2DPCA)与CNN相结合识别手写体汉字。首先,利用2DPCA提取手写体汉字的投影特征向量;然后,将得到的投影特征向量组成特征矩阵;其次,用组成的特征矩阵作为CNN的输入;最后,用Softmax函数进行分类。与基于AlexNet的CNN模型相比,所提方法的运行时间降低了78%,与基于ACNN与DCNN的模型相比,所提方法的运行时间分别降低了80%与73%。实验结果表明,该方法在不降低识别精度的同时,可以减少识别手写体汉字的运行时间。 相似文献
11.
刘晋胜 《计算机工程与应用》2012,48(12):173-178
针对图像分类特征点特性界定模糊,导致相似性度量误差较大的问题,提出采用特征点类别可分性判断准则的图像分类方法。结合信息熵理论提取图像特征点的可分性特性,根据图像特征向量标识决策属性的不同性质,计算特征向量间的可分性距离值,得到最近邻特征向量集,从待分图像各特征向量与最近邻特征向量集标识类别的平均距离,及平均可分性度量值两方面定义新的图像类别判断准则。理论分析与Caltech256图像库仿真实验表明,基于特征点类别可分性判断准则有效地提高了图像的分类准确率。 相似文献
12.
13.
14.
在脱机手写汉字识别中,笔画形变是造成识别率下降的主要原因,减少笔画形变的影响是提高脱机手写汉字识别率的关键。针对上述问题,提出了最优采样特征。该特征以目前被广泛应用的方向线素特征为基础,在一定的约束条件下,通过移动采样点的位置,可以适应笔画的形变。从而减少特征的类内方差,提高特征的可分性,改进了识别性能。通过在THCHR样本集上进行实验,并对最优采样特征和方向线素特征的实验结果进行比较,验证了最优采样特征的识别率优于方向线索特征。 相似文献
15.
16.
两类Fisher鉴别准则、大间距线性投影准则以及最大散度差鉴别准则都是直接用于模式分类的两类线性鉴别准则,它们的共同点是将“投影后数据的可分性达到最大的方向”作为最优投影方向。区别在于它们对数据可分性的定义有所不同。过去的研究成果表明,大间距线性投影分类器与支持向量机之间、大间距线性投影准则与最大散度差鉴别准则之间以及最大散度差鉴别准则与两类Fisher鉴别准则之间,均存在着这样或那样的联系。论文试图在以往研究成果的基础上进一步理清这些两类线性鉴别准则之间的内在关系,并建立一个统一的理论框架从而将基于投影后数据可分性的这些两类线性鉴别准则都纳入其中。 相似文献
17.
脱机手写体汉字识别具有重要的理论意义和实践价值,目前在小字符集方面取得了比较好的效果.对大字符集来说,仍在进行研究.为了解决大字符集的手写体汉字识别问题,一般采用多层分类的方法.根据汉字的繁简和字型结构,构造了五级的二叉树SVM模型进行汉字集的粗分类,给出了模型的构造方法.在每级分类识别当中,采用不同的汉字特征和核函数,利用"one-against-rest"算法进行细分类识别.仿真实验表明,该方法能对手写体汉字分级分类识别,具有较高的识别率. 相似文献
18.
高光谱图像在遥感领域中的应用越来越广泛,但由于自身的高数据维、波段间的高冗余度等特性给图像处理带来了一定困难,针对这个问题,提出一种基于类间可分性准则的改进萤火虫仿生算法,进行高光谱遥感波段选择。在分析萤火虫算法机理的基础上,阐述了利用该算法进行高光谱波段选择的思路,并构造波段相似性矩阵,选择欧氏距离、JM距离、光谱信息散度和离散度作为可分性准则来设置目标函数,根据目标函数值的优劣选择优势波段。最后,使用HYDICE Washington DC Mall和 HyMap Purdue Campus两个高光谱遥感影像数据进行实验验证,并利用支持向量机分类器对最佳波段组合进行精度评价,证明该算法的可行性和有效性。
相似文献
19.
脱机手写汉字识别是模式识别领域一项难题.支持向量机(SVM)也是近年来发展起来并成功的用于模式分类的新型机器学习方法,由训练集和核函数完全刻画.其中核函数的选择决定了支持向量机的性能,由于普通核函数各有其利弊,为了得到学习能力和泛化性能都很强的核函数来吸收手写汉字的变形,采用混合核函数,并运用于手写体汉字分类.实验结果表明混合核函数对手写体汉字的分类识别率要高于由普通单个核函数构造的支持向量机. 相似文献
20.
基于最小代价的多分类器动态集成 总被引:2,自引:0,他引:2
本文提出一种基于最小代价准则的分类器动态集成方法.与一般方法不同,动态集成是根据“性能预测特征”,动态地为每一样本选择最适合的一组分类器进行集成.该选择基于使误识代价与时间代价最小化的准则,改变代价函数的定义可以方便地达到识别率与识别速度之间的不同折衷.本文中提出了两种分类器动态集成的方法,并介绍了在联机手写汉字识别中的具体应用.在实验中使了3个分类器进行动态集成,因此,得到7种分类组合.在预先定义的代价意义下,我们比较了动态集成方法和其它7种固定方法的性能.实验结果证明了动态集成方法的高灵活性、实用性和提高系统综合性能的能力. 相似文献