首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
周玉 《计算机应用研究》2021,38(6):1683-1688
为了提高神经网络分类器的性能,提出一种基于K均值聚类的分段样本数据选择方法.首先通过K均值聚类把训练样本根据已知的类别数进行聚类,对比聚类前后的各类样本,找出聚类错误的样本集和聚类正确的样本集;聚类正确的样本集根据各样本到聚类中心的距离进行排序并均分为五段,挑选各类的奇数段样本和聚类错误的样本构成新的训练样本集.该方法能够提取信息量大的样本,剔除冗余样本,减少样本数量的同时提高样本质量.利用该方法,结合人工和UCI数据集对三种不同的神经网络分类器进行了仿真实验,实验结果显示在训练样本平均压缩比为66.93%的前提下,三种神经网络分类器的性能都得到了提高.  相似文献   

2.
卷积神经网络模型的训练通常需要大量的训练样本,导致训练时间过长。针对这一问题,本文提出一种基于余弦相似度的边界样本选择方法,选取边界样本构造训练集。通过该方法分别对MNIST,CIFAR10,SVHN数据集进行样本选择,利用卷积神经网络分类器进行实验研究。实验结果表明:该方法能够保留训练集中的典型样本,剔除冗余样本,从而减少训练样本的数量,缩短网络训练时间,提高网络学习效率。  相似文献   

3.
为了解决方言辨识系统中训练样本冗余的问题,提出了一种融合多样性测度的汉语方言主动辨识方法。利用SVM分类器选取不确定性的样本。根据样本间分布情况的测度算法,选取出兼具多样性的训练样本,经过多次迭代将这些最具区别性的样本组成训练集。将此训练集重新输入到SVM进行分类辨识。实验结果表明,该方法能有效克服选取样本的冗余,与传统的主动学习方法相比,在同等识别率的情况下,人工标注样本的数量减少了50%。  相似文献   

4.
基于AdaBoost分类器的图像/视频目标检测系统具有检测精度高、检测速度快的特点,但当训练样本数目多、样本描述的特征维数高时,分类器的训练过程将会异常缓慢。为有效改善分类器训练的时间性能,从限制弱分类器训练样本规模的角度,提出了一种改进的boosting分类器训练模型,即基于SC-AdaBoost的分类器训练模型。基于VOC2006数据集的车辆检测实验表明,在不损失分类器检测性能的前提下,SC-AdaBoost训练模型可明显减少分类器的训练时间。  相似文献   

5.
AdaBoost算法效果的好坏关键在于前期训练时候的弱分类器的选取,而弱分类器的选取在一定程度上依赖于样本集的选取。因而训练样本集显得十分重要。深入分析了cascade分类器与弱分类器之间的关系,从样本选取角度出发,根据检测率、漏检率与错检率三个指标,改进样本选取,提出一种快速人脸检测方法,该方法分为训练和检测两部分,主要通过对训练样本的比例优化和检测窗口的合并来实现。实验结果表明,该方法检测性能上比传统方法有更好的检测效果。  相似文献   

6.
传统AdaBoost存在一定的局限,比如训练分类器时对训练样本自身所带的噪声过于敏感,产生的分类器泛化能力不强和导致分类器过拟化问题,在训练分类器时只能静态分配分类器权重而不能自适应地对每个训练样本动态调整权重等问题。提出一种基于SBoost算法和PBoost算法,引入样本权重调节器、非平衡的样本采样、误差纠偏方法来检测潜在的样本。模拟实验表明:改进后的技术有效的提高了分类器的精确度且防止过拟化问题。  相似文献   

7.
虚拟样本是一种在学习过程中引入先验知识的有效手段,一定程度上提高了分类器的性能。然而由于生成的虚拟样本集的数据分布与原始训练集的分布不一致,因此利用虚拟样本扩充后的训练样本集进行学习的分类器分类性能上存在波动。针对这种不足,提出一种基于权重选择虚拟样本的新分类算法。该方法首先利用TrAdaBoost算法对扩充后的样本集进行预处理,然后选取权重大于某一给定阈值的样本构造新训练样本集,最后根据新样本集进行训练得到分类器。由于排出了不重要的样本,因此在新样本集上得到的分类器具有更高的精度。在部分UCI标准数据集与KDD cup 99网络入侵检测数据集上的对比实验说明了该算法较不产生虚拟样本的直接分类算法和利用虚拟样本全集进行训练的分类算法具有更高的精度。  相似文献   

8.
针对SVM算法在训练过程中,对于训练样本集过大,导致训练过程中的冗余样本和噪声会使划分超平面受到影响,于是提出使用基于密度的裁剪方法对训练样本进行裁剪,去除样本集的噪声和冗余样本,优化分类超平面的划分,提高分类准确率。而在SVM算法中的惩罚因子C和核函数g对于分类性能影响较大。提出基于粒子群算法对SVM算法进行改进,通过粒子群算法优化惩罚因子C和核参数g。使用样本集对改进算法进行实验论证,该方法确实有效地提升了SVM分类性能。  相似文献   

9.
基于子空间样本选择的最近凸包分类器   总被引:3,自引:0,他引:3       下载免费PDF全文
最近邻凸包分类器需要求解测试样本到训练集凸包距离的凸二次规划问题,对于训练集规模较大的情况,有必要在分类之前进行适当的样本选择。为此该文提出基于子空间样本选择的最近凸包分类方法。该方法首先采用子空间样本选择算法对训练集样本进行筛选,然后将各类选出的样本作为最近邻分类器的新的训练集。子空间样本选择方法的原理是在一类训练样本集内,迭代选择距离已选样本张成子空间最远的样本。在MIT-CBCL人脸识别数据库的training-synthetic子库的实验中,该方法只需5.6%的训练样本即可取得100%的识别率,并且执行时间较未经选样的最近邻凸包分类器也大为减少。  相似文献   

10.
在分析单一MU(Most Uncertainty)采样缺陷的基础上,提出一种"全局最优搜寻"方法 GOS(Global Optimal Search),并结合MU共同完成查询选择。GOS+MU方法中,GOS着眼全局寻找目标,在应用环境能提供的训练样本数量有限、分类器受训不充分时,该方法选择的对象学习价值高,能快速推进分类器学习进程;MU则能够在GOS采样失效情形下,利用分类器当前训练成果,选择查询不确定性最强的样本补充训练集。通过对网络商品的用户评论进行分类仿真,并比较其他采样学习方法的效果,证明了GOS+MU方法在压缩学习成本、提高训练效率方面的有效性。  相似文献   

11.
基于增量学习支持向量机的音频例子识别与检索   总被引:5,自引:0,他引:5  
音频例子识别与检索的主要任务是构造一个良好的分类学习机,而在构造过程中,从含有冗余样本的训练库中选择最佳训练例子、节省学习机的训练时间是构造分类机面临的一个挑战,尤其是对含有大样本训练库音频例子的识别.由于支持向量是支持向量机中的关键例子,提出了增量学习支持向量机训练算法.在这个算法中,训练样本被分成训练子库按批次进行训练,每次训练中,只保留支持向量,去除非支持向量.与普通和减量支持向量机对比的实验表明,算法在显著减少训练时间前提下,取得了良好的识别检索正确率.  相似文献   

12.
针对直升机飞行状态识别训练样本数据少而导致识别率不高的问题,提出一种基于随机森林的直升机飞行状态识别方法。首先利用去野点、限幅、平滑处理对飞行数据进行预处理,并根据特征参数将飞行状态分为8个小类;然后利用随机森林识别率较高的特点,对每一小类进行随机森林分类器设计;最后利用训练样本训练每个随机森林分类器,并将训练好的随机森林分类器识别直升机全起落飞行状态。以某型直升机实飞数据作为实验数据,将该方法与RBF神经网络法和SVM法进行对比实验,结果表明在小样本情况下该方法识别率有明显提高,识别速度也有所提高,可为直升机寿命预测提供依据。  相似文献   

13.
针对图像型火灾探测方法检测准确度和实时性间的矛盾,提出了基于粗糙集的火灾图像特征选择和识别算法。首先通过对火焰图像特征的深入研究发现,在燃烧能量的驱动下火焰的上边缘极不规则,出现明显的震动现象,而下边缘却恰恰相反; 基于此特点,可利用上下边缘抖动投影个数比作为火焰区别于边缘形状较规则的干扰。然后,选择火焰的6个显著特征构造训练样本,在火灾分类能力不受影响的前提下,使用实验所得的特征量归类表对训练样本进行属性约简,并将约简后的信息系统属性训练支持向量机模型,实现火灾探测。最后与传统支持向量机火灾探测算法做了比较。实验结果表明:将粗糙集作为支持向量机分类器的前置系统,把粗糙集理论的属性约简引入到支持向量机中,可以大大消除样本集冗余属性,降低了火灾图像特征空间的维数,减少了分类器训练和检测数据,在保证识别精度的同时,提高了算法的速度和泛化能力。  相似文献   

14.
为了从分类器集成系统中选择出一组差异性大的子分类器,从而提高集成系统的泛化能力,提出了一种基于混合选择策略的直觉模糊核匹配追踪算法.基本思想是通过扰动训练集和特征空间生成一组子分类器;然后采用k均值聚类算法将对所得子分类器进行修剪,删去其中的冗余分类器;最后根据实际识别目标动态选择出较高识别率的分类器组合,使选择性集成规模能够随识别目标的复杂程度而自适应地变化,并基于预期识别精度实现循环集成.实验结果表明,与其他常用的分类器选择方法相比,本文方法灵活高效,具有更好的识别效果和泛化能力.  相似文献   

15.
一种基于粗糙集理论的神经网络分类器的设计   总被引:4,自引:0,他引:4  
李铁鹰  崔艳 《计算机工程与应用》2005,41(32):167-168,192
文章设计了一个基于粗糙集理论的神经网络分类器。该分类器利用粗糙集理论对原始数据进行特征选择,约简了冗余特性,减小了BP网络的输入维数,提高了网络的学习效率。在对一组数据实际分类的过程中,与单纯的神经网络分类器比较,在同等精度要求的情况下该分类器网络训练时间短,识别能力强。  相似文献   

16.
目标分类器是水下目标识别系统的重要组成部分.本文针对线谱特征提取,提出了一种基于自适应遗传BP算法训练神经网络目标分类器的新方法.经对海上实录三类目标噪声分类识别实验结果表明采用新方法的神经网络分类器具有更优的分类效果.  相似文献   

17.
针对神经网络分类器训练时间长、泛化能力差的问题,提出了一种基于动态数据约简的神经网络分类器训练方法(DDR)。该训练方法在训练过程中赋给每个训练样本一个权重值作为样本的重要性度量,依据每次网络迭代训练样本的分类错误率动态更新每个训练样本的权重值,之后依据样本的权重值来约简训练样本,从而增加易错分类的边界样本比重,减少冗余核样本的作用。数值实验表明,基于权重的动态数据约简神经网络训练方法不仅大幅缩短了网络的训练时间,而且还能够显著提升网络的分类泛化能力。  相似文献   

18.
森林火灾图像识别是森林防火监测系统的核心。目前的主要研究多在图像的向量 模式表示上展开。由于向量模式的样本数由图像分辨率决定,易导致模型训练的负担过重。样 本类别标记的准确性,直接影响后续的模型训练和目标识别。而目前的类别标定工作多采用手 工或图像预处理方法完成,任务繁琐且容易出错。此外,由于像素位置在图像向量化过程中被 调整,不可避免地会损失图像原有的结构信息。鉴于此,提出了基于矩阵分块的半监督学习算 法 Semi-MHKS,优势在于:①矩阵分块形式的样本数远低于向量模式,可有效缩短训练和识别 时间;②只需标记分块类别,更有利于准确标定样本类别;③采用双线性判别函数,设计了针 对林火问题的半监督学习算法;④证明了算法的收敛性。与支持向量机(SVM)、MHKS 和半监 督的 LapMatLSSVM 方法相比,在林火图像和视频上的实验验证了 Semi-MHKS 的具有较高的 识别率和较低的训练时间。  相似文献   

19.
提出了一种新颖的基于正交投影的分类器算法。该算法将测试样本正交投影到由各类训练样本生成的子空间中,并计算测试样本到各子空间的距离,以此作为分类的依据。该算法不需要计算样本协方差矩阵的逆阵,因此特别适合于小样本问题。在ORL人脸库上的实验结果表明,该算法的模式识别率高于传统分类器方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号