首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
针对中文短文本分类问题,从集成学习的角度提出一种基于多元概率推理模型的书写纹识别方法。将初始样本集划分为等粒度、可交叉的样本子集,构造具有差异性的子空间,在各子空间上采用基于概率推理模型的基分类器训练样本,通过概率求和法融合所有基分类器的输出得到训练样本的最终识别结果。实验结果表明,该方法对于网络书写纹具有较好的识别效果,查全率、查准率和Fl度量值分别高达81.6%、85.9%和83.69%。  相似文献   

2.
网络书写纹识别技术通过分析用户在网络留言中的书写风格识别其身份.针对网络书写纹特征具有高维、冗余的特点,提出一种基于集成特征选择的识别方法.采用基于Filter与Wrapper的混合式特征选择算法对特征空间进行划分,训练出与待识别用户数相同的基分类器,使每一个基分类器成为代表一个用户的专家.通过对20个校园BBS用户的实验研究,结果表明该方法有效提高了网络书写纹的识别性能与识别模型的可理解性.  相似文献   

3.
N-gram字符是网络书写纹识别最有效的特征类型之一。针对其特征维数高、冗余特征多且无关特征少等特点,提出一种基于特征空间划分来构造集成学习分类器的网络书写纹识别方法。该方法首先根据一定的划分粒度,将初始特征集划分为等维度、无交又的特征子集,然后基于每一个特征子集训练生成对应的基分类器(多元朴素贝叶斯),最后采用算术与几何平均相结合的融合策略完成集成学习分类器的构造。特征空间的划分(即特征子集的选择)采用遗传算法进行优化。实验在一个真实数据集上开展,其结果表明该方法有效地提高了网络书写纹的识别性能。  相似文献   

4.
为更好地利用大量未标注图像样本信息来提高分类器性能,提出一种半监督学习的图像分类算法--随机半监督采样(RSSS).该算法采用迭代随机采样方法,每次采样中通过谱聚类估计未标注样本的类别值,使用SVM进行模型学习,逐步优化模型;同时,使用图像的局部空间直方图特征可以有效地结合图像的统计和空间信息,以提高分类准确度.实验结果表明,RSSS算法可以充分利用未标注样本信息提高分类器的性能,并且可以有效地消除几何变换带来的影响.  相似文献   

5.
实体识别常利用分类器根据记录对的字段相似度向量将记录对分为匹配、不匹配和可能匹配,因此分类器的准确性与实体识别的准确性直接相关。为提高分类准确性,本文基于重采样和集成选择技术构建一个多分类器系统。充分利用实体识别的特点,在分类之前发现分类困难的样本,并使重采样比率在一个区间内变化,生成一组重采样样本;然后用重采样后的样本训练分类器构建一个并行多分类器系统,强调分类器之间的差异度和稀疏度,从该多分类器系统中选择最优分类器子集,即最优的重采样比率组合,分别用非线性规划和极值方法求解该集成选择模型。实验结果表明,本方法与现有的多分类器系统相比具有更高的准确性。  相似文献   

6.
互联网金融中的网络贷款用户数据具有类别不平衡的特性,严重影响传统分类器的性能。随机平衡采样算法在对原始数据集进行重采样的过程中,将所有样本同等考虑,本文在平衡采样的过程中充分考虑样本点的性能,将其分为3类样本:安全的、边界的、噪声的,针对不同类型的样本采用相应的采样方法,得到平衡的新数据集,然后对该数据集进行Bagging集成,提高算法的泛化性能,结果表明本文改进的随机平衡采样(Improved Random Balanced Sampling, IRBS)Bagging算法可以较好地对网络贷款用户进行分类。  相似文献   

7.
为解决垃圾网页检测过程中的不平衡分类和"维数灾难"问题,提出一种基于随机森林(RF)和欠采样集成的二元分类器算法。首先使用欠采样技术将训练样本集大类抽样成多个子样本集,再将其分别与小类样本集合并构成多个平衡的子训练样本集;然后基于各个子训练样本集训练出多个随机森林分类器;最后用多个随机森林分类器对测试样本集进行分类,采用投票法确定测试样本的最终所属类别。在WEBSPAM UK-2006数据集上的实验表明,该集成分类器算法应用于垃圾网页检测比随机森林算法及其Bagging和Adaboost集成分类器算法效果更好,准确率、F1测度、ROC曲线下面积(AUC)等指标提高至少14%,13%和11%。与Web spam challenge 2007 优胜团队的竞赛结果相比,该集成分类器算法在F1测度上提高至少1%,在AUC上达到最优结果。  相似文献   

8.
脱机手写汉字识别的最优采样特征新方法   总被引:5,自引:1,他引:5       下载免费PDF全文
在脱机手写汉字识别中,笔画形变是造成识别率下降的主要原因,减少笔画形变的影响是提高脱机手写汉字识别率的关键。针对上述问题,提出了最优采样特征。该特征以目前被广泛应用的方向线素特征为基础,在一定的约束条件下,通过移动采样点的位置,可以适应笔画的形变。从而减少特征的类内方差,提高特征的可分性,改进了识别性能。通过在THCHR样本集上进行实验,并对最优采样特征和方向线素特征的实验结果进行比较,验证了最优采样特征的识别率优于方向线索特征。  相似文献   

9.
概率引导的随机采样一致性算法   总被引:3,自引:0,他引:3  
为了提高随机采样一致性算法的计算效率,提出一种概率引导的随机采样一致性算法.根据采样模型在原始数据上的检验结果调整每个样本点的采样概率,使得正确样本和正确模型被采样的概率得到提高.在首次获得正确模型之后,样本采样与模型更新构成了一个正反馈环节,经过若干次迭代后,正确样本被采样的概率远超过错误样本被采样的概率.理论分析和实验数据表明,该算法收敛需要的迭代次数较少,有效地提高了随机采样一致性算法的效率.  相似文献   

10.
一种基于局部随机子空间的分类集成算法   总被引:1,自引:0,他引:1  
分类器集成学习是当前机器学习研究领域的热点之一。然而,经典的采用完全随机的方法,对高维数据而言,难以保证子分类器的性能。 为此,文中提出一种基于局部随机子空间的分类集成算法,该算法首先采用特征选择方法得到一个有效的特征序列,进而将特征序列划分为几个区段并依据在各区段的采样比例进行随机采样,以此来改进子分类器性能和子分类器的多样性。在5个UCI数据集和5个基因数据集上进行实验,实验结果表明,文中方法优于单个分类器的分类性能,且在多数情况下优于经典的分类集成方法。  相似文献   

11.
为避免传统均匀采样方法因忽视曲线重要特征而生成不理想的采样结果,获得给定数量且由特征点和辅助点组成的采样点序列,提出基于特征识别的高质量空间曲线非均匀采样方法.首先使用抛物线插值法得到曲线上所有曲率极大值点和挠率极大值点的近似位置,经筛选后产生特征点,以更好地抓住空间曲线的轮廓特征.然后定义基于弧长、曲率和挠率加权组合的特征函数,并以此自适应地选取曲线上的辅助点.与3种主流采样方法比较的实验结果表明,该方法能够获得更高质量的采样结果且具有更好的实用性,从而进一步改善空间曲线的B样条拟合效果.  相似文献   

12.
集成特征选择的广义粗集方法与多分类器融合   总被引:2,自引:0,他引:2  
为改善多分类器系统的分类性能, 提出了基于广义粗集的集成特征选择方法. 为在集成特征选择的同时获取各特征空间中的多类模式可分性信息, 研究并提出了关于多决策表的相对优势决策约简, 给出了关于集成特征选择的集成属性约简 (Ensemble attribute reduction,EAR) 方法, 结合基于知识发现的 KD-DWV 算法进行了高光谱遥感图像植被分类比较实验. 结果表明, EAR 方法与合适的多分类器融合算法结合可有效提高多分类器融合的推广性.  相似文献   

13.
如何构造差异性大的基分类器是集成学习研究的重点,为此提出迭代循环选择法:以最大化正则互信息为准则提取最优特征子集,进而基于此训练得到基分类器;同时以错分样本个数作为差异性度量准则来评价所得基分类器的性能,若满足条件则停止,反之则循环迭代直至结束.最后用加权投票法融合所选基分类器的识别结果.通过仿真实验验证算法的有效性,以支持向量机为分类器,在公共数据集UCI上进行实验,并与单SVM及经典的Bagging集成算法和特征Bagging集成算法进行对比.实验结果显示,该方法可获得较高的分类精度.  相似文献   

14.
针对掌纹在非接触采集时易出现模糊现象从而导致系统识别性能降低的问题,建立了区域到点的特征映射模型,提出了一种基于区域特征映射(Region feature map, RFM)的模糊掌纹识别方法.首先根据图像的模糊原理,建立等价的模糊模型,获取模糊掌纹; 然后使用RFM对模糊掌纹进行操作,将高维的区域特征映射到低维的点特征; 最后,采用归一化相关性分类器对掌纹所属类别进行判定识别.使用模糊模型对PolyU掌纹库进行处理得到PolyU模糊掌纹库,并分别在PolyU掌纹库和PolyU模糊掌纹库上进行测试,识别结果较为稳定. 在模糊掌纹库上,本文算法的等错误率(Equal error rate, EER)最小可达0.9069%,优于传统算法,且进行一次识别的时间为33.95ms,得到的特征数据维数较小,降低了算法复杂度,表明了本文算法的有效性和实时性.  相似文献   

15.
特征采样和特征融合的子图像人脸识别方法   总被引:3,自引:0,他引:3  
朱玉莲  陈松灿 《软件学报》2012,23(12):3209-3220
提出一种基于特征采样和特征融合的子图像人脸识别方法(RS-SpCCA).首先,对子图像进行特征采样;然后,将全局特征和采样后的特征使用CCA进行信息融合,以获取包含全局特征和局部特征的相关特征;最后,在相关特征上构建分量分类器.在该方法中,特征采样是为了构建更多且多样的分量分类器;而引入特征融合思想是为了充分利用图像的全局特征.AR,Yale和ORL这3个数据库上的实验结果表明,基于特征采样和特征融合的子图像方法(RS-SpCCA)优于单纯的信息融合方法(SpCCA)和特征采样方法(Semi-RS).  相似文献   

16.
特征提取算法在工件识别中的研究   总被引:1,自引:0,他引:1  
特征提取在工件识别中具有重要的意义. 运用灰度变换与平滑去噪对获取到的原始图像进行图像预处理. 提出改进的工件特征提取方法. SURF算法作为SIFT算法的加速版,不仅能够确保检测到的特征点的稳定性,而且能很大程度地加快特征提取的时间,满足了工件识别过程中实时性的需求. 采用改进的SURF算法的特征匹配方法进行工件的识别. 实验表明,改进的特征匹配方法对工件识别精确且速度较快.  相似文献   

17.
针对在大规模数据集上进行聚类困难的问题,分析了抽样技术的优点,研究了数据挖掘领域中的随机抽样的特点,并在此基础上提出了一种基于密度的偏差抽样方法.利用密度偏差抽样所获得的样本数据集能够较准确地反映总体数据集的特征,并且能够灵活地控制对数据集不同区域的抽样率.实验证明,在大规模数据集上进行聚类时,密度偏差抽样在时间复杂度上要优于随机抽样.  相似文献   

18.
根据人体步态变化特点,提出一种基于特征融合和神经网络的步态识别算法。首先采用时域差分法对运动人体轮廓进行分割,然后分别提取空间特征和频率特征,将两步态特征融合在一起,从而实现步态的分类和识别。在CASIA步态数据库上进行仿真实验,仿真结果表明,该方法不仅克服了单一特征提取方法存在的缺陷,同时提高了步态识别正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号