首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 609 毫秒
1.
胡声丹  苗夺谦  姚一豫 《计算机学报》2021,44(11):2332-2343
属性约简是粗糙集理论的重要应用之一.为了对部分标记的数据进行属性约简,一些基于粗糙集的半监督属性约简方法相继被提出,但这些方法在数据信息利用、运行代价、约简质量等方面仍然存在挑战.本文针对混合型分类数据,提出了一种新的基于三支标签传播的半监督属性约简(3WLPME)方法.该方法包括两个过程:三支标签传播(3WLP)和基于混合熵的启发式属性约简(MEHAR).其中,3WLP在经典标签传播算法的基础上,结合三支决策和主动学习思想,对无标签数据进行标注,并更新有标签集和无标签集.迭代执行上述过程直至收敛,可以提升最终的伪标签准确率.在MEHAR中,属性重要度由混合熵度量.基于依赖度和条件熵定义的混合熵,融合了粗糙集的代数表示和信息表示,能更深刻地反映属性的分类能力.本文对3WLP算法和MEHAR算法的有效性进行了理论分析.在UCI数据集上进行了以下仿真实验:3WLP与随机标签传播在伪标签准确率上的对比;不同属性约简算法在约简质量上的对比;3WLPME与其他基于粗糙集的半监督属性约简方法,在约简质量上的对比.实验结果验证了3WLP能获得较高的伪标签准确率;MEHAR在不降低分类准确率的前提下,能获得较小的约简;3WLPME在半监督约简过程中具有更高的效率和稳定性,说明本文所提方法是有效的.  相似文献   

2.
属性约简是粗糙集核心内容之一,然而,传统基于邻域粗糙集的局部约简算法具有以下两个问题:1)经典邻域粗糙集没有关注到半径变化对样本标签的影响,以致于不同标签样本被划分到相同邻域;2)传统的属性约简算法只有一个约束条件,缺乏适用性.为了解决这一难题,论文从局部视角出发,利用伪标签邻域粗糙集模型,构建了一种属性约简方法.实验选取五组UCI数据集,通过多个算法的对比分析,论文所提算法提高了分类性能.  相似文献   

3.
基于深度学习的边缘检测算法需要大量的标注,这阻碍了边缘检测的推广应用。因此提出一种伪监督边缘检测算法,能够在无标注的手绘图像数据集上提取图像边缘。算法分成三部分,包括伪监督标签生成、多尺度边缘检测网络和特征增强模块。伪监督标签为多尺度监督的边缘检测网络生成监督信息,特征增强模块可以弥补伪监督带来的信息丢失。该算法比现有边缘检测算法提取的边缘更完整,在手绘数据集QMUL-Shoe和QMUL-Chair上可以提高1%~6%的检索精度,对需要边缘检测的所有领域都有启发性意义。  相似文献   

4.
针对现有粗糙集属性约简方法中存在的连续数据处理时的信息丢失、粒化策略引入不一致信息、参数寻优困难等问题,提出一种适用于连续型数据、基于类别可区分度的非单调性启发式属性约简算法。首先以各样本的标签为依据对论域进行划分,同一标签的样本组合成一个簇,定义每个簇的类间可区分度和类内可区分度;其次,以最大化类间可区分度、最小化类内可区分度为约简原则,定义了一种新的属性重要性判别准则以确定最优约简集,从而提高后续分类器的分类性能。在十一个UCI数据集上与其他六种属性约简算法进行对比实验。结果表明,与六种算法相比,所提算法获得的约简集平均维度减小了1.16,平均分类精度提高了3.42%,其表现出更好的约简性能。  相似文献   

5.
现有的有监督可见光-近红外行人重识别方法需要大量人力资源去除手工标注数据,容易受到标注数据场景的限制,难以满足真实多变应用场景的泛化性.因此,文中提出基于语义伪标签和双重特征存储库的无监督跨模态行人重识别方法.首先,提出基于对比学习框架的预训练方法,利用可见光行人图像和其生成的辅助灰度图像进行训练.利用该预训练方法获取对颜色变化具有鲁棒性的语义特征提取网络.然后,使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类方法生成语义伪标签.相比现有的伪标签生成方法,文中提出的语义伪标签在生成过程中充分利用跨模态数据之间的结构信息,减少跨模态数据颜色变化带来的模态差异.此外,文中还构建实例级困难样本特征存储库和中心级聚类特征存储库,充分利用困难样本特征和聚类特征,让模型对噪声伪标签具有更强的鲁棒性.在SYSU-MM01、RegDB两个跨模态数据集上的实验验证文中方法的有效性.  相似文献   

6.
行人重识别是计算机视觉领域的热点研究课题之一。近年来,为了解决行人重识别实际应用中标签数据稀缺的问题,同时也为了有效地利用现有的标签数据,研究者们提出了基于生成对抗网络以及基于伪标签的领域自适应方法,用于进行跨领域的行人重识别研究。基于伪标签的无监督领域自适应行人重识别方法由于效果显著而备受研究者的青睐。文中梳理了近7年来基于伪标签的无监督领域自适应行人重识别的研究成果,将基于伪标签的方法从模型训练角度划分为两个阶段。1)伪标签生成阶段。现有工作的伪标签生成方法大多使用聚类方法,部分工作采用基于图结构学习的图匹配、图卷积网络方法来生成目标域的伪标签。2)伪标签精炼阶段。文中将现有的伪标签精炼方法归纳为基于表征学习的精炼方法以及基于相似度学习的精炼方法,并分别进行模型方法的总结与整理。最后,讨论现阶段基于伪标签的无监督领域自适应行人重识别面临的挑战并对未来可能的发展方向进行展望。  相似文献   

7.
粗糙集理论能对系统中的冗余信息进行约简,但其处理过程完全基于样本集,样本集的完备性对其处理结果有直接影响.对粗糙集理论及其在故障诊断中属性约简存在的问题进行了分析,通过实例证明了在故障样本集不完备的情况下,利用粗糙集进行的属性约简会由于新故障样本的引入而导致前后约简结果的不一致,从而影响诊断的准确性;指出了该问题产生的关键原因及解决的办法,并给出了相关的实现算法,以提高系统的故障诊断自适应性.  相似文献   

8.
图像聚类是图像处理中一个重要且开放的问题。最近,一些方法利用联合对比学习的良好表征能力来进行端到端聚类学习,利用伪标签技术来生成高质量的伪标签以提升聚类模型的鲁棒性。伪标签方法通常需要设置一个较大的概率阈值,并对满足要求的样本生成one-hot的标签,同时利用生成的标签来更新模型。但是,这种简单的伪标签生成方法难以获得足够数量的高质量伪标签。为了解决以上问题,提出了一种基于分层伪标签的图像聚类方法,它旨在利用结构化信息与伪标签信息对分类模型进行训练和精炼。引入3个假设来指导聚类方法的设计,包括局部平滑假设、自训练假设及低密度分离假设。新方法包含两个阶段:1)基于流形的一致性学习,利用近邻一致性学习来初始化聚类模型;2)基于分层伪标签的模型精炼,基于第一阶段的结果生成伪标签,并利用其来提升聚类模型的鲁棒性。首先,将基于第一阶段的结果生成强伪标签数据集及弱伪标签数据集;然后,提出了基于标签传播及分层混合的伪标签提升技术来提升弱伪标签数据集的质量;最后,同时利用强伪标签数据集及弱伪标签数据集来提升分类模型的泛化能力。相较于最优结果,SPC算法在STL10和Cifar100-20基准数据集上,...  相似文献   

9.
粗糙集理论能对系统中的冗余信息进行约简,但其处理过程完全基于样本集,样本集的完备性对其处理结果有直接影响。对粗糙集理论及其在故障诊断中属性约简存在的问题进行了分析,通过实例证明了在故障样本集不完备的情况下,利用粗糙集进行的属性约简会由于新故障样本的引入而导致前后约简结果的不一致,从而影响诊断的准确性;指出了该问题产生的关键原因及解决的办法,并给出了相关的实现算法,以提高系统的故障诊断自适应性。  相似文献   

10.
传统的并行属性约简算法通过利用抽样技术获取小数据样本进行知识约简,但对于大数据集来说,样本数据不具有一般性且无法代表整个数据集.为了弥补传统并行属性约简算法只能用来计算最小属性约简、处理小数据集的缺陷,论文通过分析了先验知识在粒计算中的重要性,结合云计算技术处理海量数据的优势,以粗糙集理论为背景,从不同角度、层次出发建立层次粗糙集模型,提出基于云计算的层次粗糙集模型约简算法,讨论并实现了知识约简算法中的可并行化操作,利用Hadoop在普通计算机集群上进行试验,从运行时间、加速比、可扩展性三个方面对所提出基于正区域、信息熵、边界域算法的重要性进行评价.实验证明:基于云计算的层次粗糙集模型约简算法可以有效处理大数据集.  相似文献   

11.
针对不完备弱标记数据的学习问题,提出基于粗糙集理论的半监督协同学习模型.首先定义不完备弱标记数据的半监督差别矩阵,提出充分、具有差异性的约简子空间获取算法.然后在有标记数据集上利用各约简子空间训练两个基分类器.在无标记数据上,各分类器基于协同学习的思想标注信度较大的无标记样本给另一分类器学习,迭代更新直至无可利用的无标记数据.UCI数据集实验对比分析表明,文中模型可以获得更好的不完备弱标记数据的分类学习性能,具有有效性.  相似文献   

12.
乐毅  郑诚  吴国栋 《计算机技术与发展》2007,17(10):250-252,F0003
使用基于粗糙集(Rough Set)约简并和抽样结合来约简KDD99的海量数据中的属性,降低属性之间的相关性。使用具有广泛数学基础的粗糙集约简海量网络侦听数据的属性,产生具有较好的独立性入侵检测属性集,学习的时间效率也得到提高。通过具有相通理论基础的决策树印证约简的有效性和检测的时间效率并生成检测规则。  相似文献   

13.
粒矩阵属性约简的启发式算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论一个重要的研究问题.在粗糙集理论上,利用粒计算的思想构建了粒矩阵,提出并定义了粒矩阵相与运算,建立了基于粒矩阵的知识粒化方法,并且给出了粒矩阵属性约简的启发式算法.采用粒矩阵进行属性约简选择最小属性集,跳出了传统属性约简的先求解属性核,再求解最优属性集的方法.理论分析表明了新的算法是可靠有效的,给粒计算属性约简提供一个新的思路,为进一步研究粒计算提供可行的方法.  相似文献   

14.
针对通信辐射源个体识别技术中有标签信号样本不足导致个体识别准确率较低的问题,提出了基于伪标签半监督深度学习的辐射源个体识别方法,该方法利用加权平均思想改进了伪标签的赋值方式,有效增强了伪标签的质量,提升了网络模型的鲁棒性;介绍了如何基于伪标签思想设计半监督深度学习方法,并运用熵正则化算法的概念从理论方面解释了伪标签的有效性;实验设计了适合于信号样本的卷积神经网络,采取不同数目的有标签样本与无标签样本组建的训练集方案,得到了改进的伪标签半监督方法在测试集的识别准确率,结果表明,该方法较全监督方法和改进前的伪标签半监督方法有着更好的识别效果和更强的优越性.  相似文献   

15.
差别矩阵浓缩及其属性约简求解方法   总被引:4,自引:0,他引:4  
杨明  杨萍 《计算机科学》2006,33(9):181-183
属性约简是粗糙集理论的重要研究内容之一,已出现大量的属性约简算法,其中基于差别矩阵的属性约简算法是高效属性约简算法之一,但这些算法主要针对一致决策表,而对于不一致决策表,某些情况下不能得到属性约简。为此,本文提出改进的差别矩阵及其属性约简求解方法,统一考虑决策表一致和不一致情况两种情况下的属性约简,有效改进经典的基于差别矩阵求解属性约简的不足。同时,为适应大数据集属性约简需要,提出一种新的差别矩阵浓缩策略,以此提高属性约简的效率。  相似文献   

16.
实际应用中的许多数据,如图像,视频,通常具有张量性和高维性特征,张量数据的维数约简便成为近期的研究热点。现有的张量维数约简方法大都是监督的,它们不能有效利用未标签样本数据的信息。基于调和函数的张量数据维数约简方法综合了传统半监督方法和张量方法的优点,能够在有效利用未标签样本信息的同时,保持数据天然的张量结构特征。仿真实验和真实数据上的结果都验证了其有效性。  相似文献   

17.
在粗糙集理论研究的诸多方面中,属性约简是其核心问题之一.为寻求高效、快捷的属性约简算法,从粗糙集理论出发,在可分辨关系和对象差异矩阵概念的基础上,构造出"基于分辨能力指数的启发式约简算法".算法采用自底向上的方法,以属性集的核作为求解约简的基础,利用分辨能力指数信息作为属性选取的依据.算法简化了计算,无需生成中间结果,没有增加系统的时空开销.最后,UCI数据集的测试结果表明,启发式约简算法有效、可行.  相似文献   

18.
变精度粗糙集的属性核和最小属性约简算法   总被引:6,自引:0,他引:6  
陈昊  杨俊安  庄镇泉 《计算机学报》2012,35(5):1011-1017
文中深入研究了变精度粗糙集的属性约简问题,给出了3种属性约简的概念,针对不同概念的属性约简,分别提出了两种不同的求解变精度粗糙集最小属性约简算法:基于容差矩阵和属性核的最小约简.提出了变精度粗糙集的属性核思想,对其进行了形式化描述,说明了变精度粗糙集的属性核真正具备了核的本质特征,从而更深层地提出了基于属性核的启发式约简以求解最小约简.理论分析和实例表明,所提出的两种最小约简算法可以减小属性约简的搜索空间,提高约简的效率,使得变精度粗糙集的属性约简具有了实用性.  相似文献   

19.
针对粒子群属性约简算法容易早熟、易陷入局部最优解的问题,提出一种融合混沌离散粒子群与粗糙集的属性约简算法(CBPSORS).在该算法中,首先利用混沌序列初始化粒子的位置和速度,得到一个无序的粒子种群.其次改进最优粒子进行混沌变异过程,改进惯性因子和加速因子来提高算法性能.再次用粗糙集理论对生成的属性子集相关性进行评估.最后用K-近邻(KNN)算法生成分类模型在UCI数据集上对该算法进行验证.理论分析与实验结果表明,与基于粗糙集的属性约简算法(RS)、基于粒子群的粗糙集属性约简算法(PSORS)以及基于遗传算法的粗糙集属性约简算法(GARS)相比,文中算法可以在保持决策表知识信息的前提下,约减掉更多的条件属性,提高分类精度.  相似文献   

20.
基于幂图的属性约简搜索式算法   总被引:7,自引:0,他引:7  
粗糙集理论是一种新的处理不精确、不完全与不一致数据的数学工具.属性约简是粗糙集理论的重要研究内容之一,已有的属性约简算法主要是基于代数表示与信息表示的方法.同一问题在不同的知识表示下,其求解难度是不同的.文中从改变属性约简问题的知识表示人手,提出了该问题的一种新的表示方式--幂图;给出了基于幂图的属性约简搜索式算法,把属性约简计算问题转化为在幂图中的搜索问题.理论分析表明新算法是有效的,为属性约简研究提供了一条新的途径.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号