首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
针对如何使用标记和未标记数据进行Web分类这一关键性问题,探索一种生成模型和判别模型相互结合的分类器,在无标记训练集中采用最大似然估计,构造一种具有良好分类性能的半监督分类器。利用狄利克雷-多项式混合分布对文本进行建模,提出了适用于半监督学习的混合模型。针对半监督学习的EM算法收敛速度过快,容易陷入局部最优的难题,引入两种智能优化的方法——模拟退火算法和遗传算法进行分析和处理,结合这两种算法形成一种新型智能的半监督分类算法,并且验证了该算法的可行性。  相似文献   

2.
类不均衡的半监督高斯过程分类算法   总被引:1,自引:0,他引:1  
针对传统的监督学习方法难以解决真实数据集标记信息少、训练样本集中存在类不均衡的问题,提出了类不均衡的半监督高斯过程分类算法。算法引入自训练的半监督学习思想,结合高斯过程分类算法计算后验概率,向未标记数据中注入类标记以获得更多准确可信的标记数据,使得训练样本的类分布相对平衡,分类器自适应优化以获得较好的分类效果。实验结果表明,在类不均衡的训练样本及标记信息过少的情况下,该算法通过自训练分类器获得了有效标记,使分类精度得到了有效提高,为解决类不均衡数据分类提供了一个新的思路。  相似文献   

3.
基于半监督学习的SVM-Wishart极化SAR图像分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
滑文强  王爽  侯彪 《雷达学报》2015,4(1):93-98
该文针对极化SAR (Synthetic Aperture Radar)图像分类中的小样本问题,提出了一种新的半监督分类算法。考虑到极化SAR数据反映了地物的散射特性,该方法首先利用目标分解方法提取了多种极化散射特征;其次,在协同训练框架下结合SVM分类器构建了协同半监督模型,该模型可以同时利用有标记和无标记样本对极化SAR图像进行分类,从而在小样本时可以获得更好的分类精度;最后,为进一步改善分类结果,在协同训练分类完成后,该方法又利用Wishart分类器对分类结果进行修正。理论分析与实验表明,该算法在只有少量标记样本的情况下优于传统算法。   相似文献   

4.
盛凯  刘忠  周德超  魏启航  冯成旭 《电子学报》2018,46(11):2642-2649
为了提高多类半监督分类的性能,提出了一种基于证据理论的多类协同森林算法(DSM-Co-Forest).首先,通过"多对多"模式将有标记的多类数据随机拆分为多个二类数据集,并以此训练二类基分类器;然后,利用多个基分类器同时对未标记样本进行预测,并利用证据组合算法挑选出可信度较高的未标记样本;最后,将高可信度的未标记样本加入到原训练样本中,以迭代更新其他的基分类器,从而提高分类器的整体性能.通过在一些公共数据集上进行实验,并与其他半监督分类算法进行对比,验证了所提算法的可行性和有效性.  相似文献   

5.
余游  冯林  王格格  徐其凤 《电子学报》2019,47(11):2284-2291
如何将带有大量标记数据的源域知识模型迁移至带有少量标记数据的目标域是少样本学习研究领域的热点问题.针对现有的少样本学习算法在源域数据与目标域数据的特征分布差异较大时存在的泛化能力较弱的问题,提出一种基于伪标签的半监督少样本学习模型FSLSS(Few-Shot Learning based on Semi-Supervised).首先,利用pytorch深度学习框架建立一个关系型深度学习网络,并使用源域数据对网络进行预训练;然后,使用此网络对目标域数据进行分类预测,将分类概率最大的类标签作为数据的伪标签;最后,利用目标域的伪标签数据和源域的真实标签数据对网络进行混合训练,并重复伪标签标记与混合训练过程.实验结果表明,相对于现有主流少样本学习算法,FSLSS模型有更好的泛化能力及知识迁移效果.  相似文献   

6.
针对恶意流量样本特征变化较快,准确标记困难的问题,提出了一种基于半监督多视图特征协同训练的网络恶意流量识别方法.该方法能够使用大量的未标记数据协同训练分类模型,提升分类模型的泛化能力.使用原始字节流特征和网络流统计特征,构建两种特征视图,借助协同训练框架进行半监督的恶意流量识别.分别使用两个公开数据集对模型训练和测试,...  相似文献   

7.
半监督学习是一种结合监督学习与无监督学习的学习方法,通过利用未标记数据,提高标记数据所建立模型的效果,目的是减少传统的机器学习任务中对大量标注数据的需求、降低人工成本.在中文电子病历实体识别领域,由于缺少足够的标注数据,且医学文本专业性较强、人工标注成本高,可以利用半监督学习方法,提升少量标注数据的训练效果.本文介绍了中文电子病历实体识别的研究背景和半监督学习的相关研究,并应用改进后的Tri-Training算法,提升中文电子病历实体识别模型的效果.  相似文献   

8.
基于随机子空间的半监督协同训练算法   总被引:3,自引:1,他引:2       下载免费PDF全文
王娇  罗四维  曾宪华 《电子学报》2008,36(Z1):60-65
 半监督学习是近年来的一个研究热点.协同训练(co-training)是利用未标记数据来提高传统监督学习性能的一种半监督学习范式.本文提出一种基于随机子空间的协同训练算法(RAndom Subspace CO-training,简称为RAS-CO).该算法探讨多视图的协同训练.用随机判别的理论分析了算法的分类精度和泛化能力.讨论了随机子空间的维数和个数对分类性能的影响.在UCI数据集上的实验结果表明,与其它同类算法相比,RASCO算法有较好的性能.  相似文献   

9.
一种采用高斯隐马尔可夫随机场模型的遥感图像分类算法   总被引:1,自引:0,他引:1  
该文研究了无监督遥感图像分类问题。文中构造了图像的隐马尔可夫随机场模型(HiddenMarkov Random Fleid,HMRF),并且提出了基于该模型的图像分类算法。该文采用有限高斯混合模型(Finite Gaussian Mixture,FGM)描述图像像素灰度的条件概率分布,使用EM(Expectation-Maximization)算法解决从不完整数据中估计概率模型参数问题。针对遥感图像分布的不均匀特性,该文提出的算法没有采用固定的马尔可夫随机场模型参数,而是在递归分类算法中分级地调整模型参数以适应区域的变化。实验结果表明了该文算法的有效性,分类算法处理精度高于C-Means聚类算法.。  相似文献   

10.
综合运用D-S证据理论和Forest算法,构建得到一种以证据理论为基础的多类半监督分类算法。先以随机方式对多类数据进行组合分类共得到两类数据,再对初始分类器进行训练;利用D-S证据理论来融合部分分类器对未标记样本的分类情况。研究结果表明:随着分类器的数量上升,分类准确率表现为持续升高的现象,但上升幅度不断减小,还会引起学习耗时的快速上升。进行实际半监督学习时,需综合考虑分类准确率与学习耗时来确定最终的分类器数量。当可信度阈值t增大后,可以获得更多的没有参与训练的未标记样本数量。在t逐渐增大的过程中,分类器的分类正确率表现为先上升后下降的现象,并在t等于0.8的条件下到达最大值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号