首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
胡声丹  苗夺谦  姚一豫 《计算机学报》2021,44(11):2332-2343
属性约简是粗糙集理论的重要应用之一.为了对部分标记的数据进行属性约简,一些基于粗糙集的半监督属性约简方法相继被提出,但这些方法在数据信息利用、运行代价、约简质量等方面仍然存在挑战.本文针对混合型分类数据,提出了一种新的基于三支标签传播的半监督属性约简(3WLPME)方法.该方法包括两个过程:三支标签传播(3WLP)和基于混合熵的启发式属性约简(MEHAR).其中,3WLP在经典标签传播算法的基础上,结合三支决策和主动学习思想,对无标签数据进行标注,并更新有标签集和无标签集.迭代执行上述过程直至收敛,可以提升最终的伪标签准确率.在MEHAR中,属性重要度由混合熵度量.基于依赖度和条件熵定义的混合熵,融合了粗糙集的代数表示和信息表示,能更深刻地反映属性的分类能力.本文对3WLP算法和MEHAR算法的有效性进行了理论分析.在UCI数据集上进行了以下仿真实验:3WLP与随机标签传播在伪标签准确率上的对比;不同属性约简算法在约简质量上的对比;3WLPME与其他基于粗糙集的半监督属性约简方法,在约简质量上的对比.实验结果验证了3WLP能获得较高的伪标签准确率;MEHAR在不降低分类准确率的前提下,能获得较小的约简;3WLPME在半监督约简过程中具有更高的效率和稳定性,说明本文所提方法是有效的.  相似文献   

2.
本文主要研究基于粗糙集理论的属性约简算法.提出了一种基于属性重要度和相关度的启发式约简算法.并通过算例验证了该算法的可行性和有效性.  相似文献   

3.
一种新的基于粗糙集的值约简算法   总被引:14,自引:1,他引:14  
林嘉宜  彭宏  郑启伦 《计算机工程》2003,29(4):70-71,129
对粗糙集(Rough Set)理论中属性约简和值约简算法进行了研究,提出了一种新的基于粗糙集的值约简算法,实验表明,该算法所得结果比目前通用的基于粗糙集的值约简算法更简化和有效,它可以应用到各种与值约简相关的实际问题中。  相似文献   

4.
刘甲伟  栾爽 《数字社区&智能家居》2009,5(8):6088-6089,6101
值约简是粗糙集理论的一个重要研究课题。而现有的很多值约简算法。在执行效率上还有待提高。通过对现有的启发式值约简算法的研究,提出了一种新的基于属性值重要性的粗糙集值约简算法,并通过实例分析验证了该算法的可行性和有效性。  相似文献   

5.
传统的有监督度量学习算法没有利用大量存在的无标记样本,且得到的度量矩阵复杂,难以了解不同原始特征的重要程度。针对这些情况,提出基于半监督假设的半监督稀疏度量学习算法。根据三样本组约束建立间隔损失函数;基于平滑假设、聚类假设、流形假设这三个半监督假设建立半监督正则项,并利用L_1范数建立稀疏正则项;利用梯度下降法求解目标函数。实验结果表明,该算法学习得到的度量能有效地使不同类别的样本间距离增大,度量矩阵具有稀疏性,分界面穿过低密度区域,该算法在UCI的样本数据集上具有良好的分类准确性。  相似文献   

6.
值约简是粗糙集理论的一个重要研究课题。而现有的很多值约简算法,在执行效率上还有待提高。通过对现有的启发式值约简算法的研究,提出了一种新的基于属性值重要性的粗糙集值约简算法,并通过实例分析验证了该算法的可行性和有效性。  相似文献   

7.
基于半监督流形学习的人脸识别方法   总被引:1,自引:0,他引:1  
黄鸿  李见为  冯海亮 《计算机科学》2008,35(12):220-223
如何有效地将流形学习(Manifold learning,ML)和半监督学习(Semi-supervised learning,SSL)方法进行结合是近年来模式识别和机器学习领域研究的热点问题.提出一种基于半监督流形学习(Semi-supervised manifold learning,SSML)的人脸识别方法,它在部分有标签信息的人脸数据的情况下,通过利用人脸数据本身的非线性流形结构信息和部分标签信息来调整点与点之间的距离形成距离矩阵,而后基于被调整的距离矩阵进行线性近邻重建来实现维数约简,提取低维鉴别特征用于人脸识别.基于公开的人脸数据库上的实验结果表明,该方法能有效地提高人脸识别的性能.  相似文献   

8.
一般启发式值约简算法中启发信息选取不够合理,获取规则的置信度不高,同时还需要多次遍历决策表,时间开销较大。针对上述问题,提出了一种基于加权平均的属性值重要度的概念,并利用受限区分矩阵构造了一种新的值约简方法。该方法无须多次遍历决策表,且不必考虑属性值恢复的问题,大大方便了规则摄取,有效地降低了计算的时间复杂度,且属性值约简更加合理,保证了最后获取的规则具有较高的置信度。最后通过真实的医学数据实验结果表明,该方法具有较好的约简效果。  相似文献   

9.
基于分歧的半监督学习   总被引:9,自引:0,他引:9       下载免费PDF全文
周志华 《自动化学报》2013,39(11):1871-1878
传统监督学习通常需使用大量有标记的数据样本作为训练例,而在很多现实问题中,人们虽能容易地获得大批数据样本,但为数据 提供标记却需耗费很多人力物力.那么,在仅有少量有标记数据时,可否通过对大量未标记数据进行利用来提升学习性能呢?为此,半监督学习 成为近十多年来机器学习的一大研究热点.基于分歧的半监督学习是该领域的主流范型之一,它通过使用多个学习器来对未标记数据进行利用, 而学习器间的\"分歧\"对学习成效至关重要.本文将综述简介这方面的一些研究进展.  相似文献   

10.
约简的一种启发式算法   总被引:4,自引:0,他引:4  
本文揭示了约简在数量上的蕴涵的一个重要性质,由此给出又一种属性重要性的定义及相应的启发式算法,并对算法进行了详细的分析。文章最后还类似地讨论了相对约简。  相似文献   

11.
基于粗糙集的一种属性值约简算法及其应用   总被引:1,自引:0,他引:1  
阐述粗糙集理论的基本概念,并且对属性约简和值约简算法进行研究,提出了一种基于粗糙集的属性值约简算法.通过实例介绍该算法的应用.研究表明,该算法不仅能得到最佳的决策规则,而且能够大大降低信息系统所需的存储空间,该算法可以解决各种有关的实际问题.  相似文献   

12.
一种基于粗集理论的增量式属性约简算法   总被引:2,自引:1,他引:2  
增量式学习中,当信息系统的对象和决策属性不变而不断增加条件属性时,为了获得该系统的约简属性,一般方法是对决策表中的所有数据重新计算,但这种方法显然效率很低且不必要.在粗集理论的基础上,给出相对区分矩阵和绝对区分矩阵的定义,提出一种新的增量式属性约简算法.通过实例得知:由该算法得到的属性约简与传统算法得到的属性约简结果相同,但该算法不仅降低了时间复杂度而且其分类质量一般要优于原来的分类质量,所以该属性约简具有一定的实用价值.  相似文献   

13.
一种基于粗集的值约简方法   总被引:9,自引:0,他引:9  
针对Rough Set理论中的值约简问题进行了研究,对基于决策间不可区分关系的值约简算法进行了改进,使其能够处理信息系统出现的各种情况。  相似文献   

14.
粗糙集理论的主要思想是在保持信息系统分类能力不变的前提下,通过知识约简,导出问题的决策和分类规则:本文提出一种基于信息量的属性约简和规则提取的集成算法,并结合汽车里程试验数据进行验证,通过仿真实验,表明了该算法的有效性和可行性。  相似文献   

15.
属性约简是粗糙集理论中重要的研究内容之一,是数据挖掘中知识获取的关键步骤。Pawlak粗糙集约简的对象一般是有标记的决策表或者是无标记的信息表。而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据。为此,结合半监督协同学习理论,提出了处理半监督数据的属性约简算法。该算法首先在有标记数据上构造两个差异性较大的约简来构造基分类器;然后在无标记数据上交互协同学习,扩大有标记数据集,获得质量更好的约简,构造性能更好的分类器,该过程迭代进行,从而实现利用无标记数据提高有标记数据的约简质量,最终获得质量较好的属性约简。UCI数据集上的实验分析表明,该算法是有效且可行的。  相似文献   

16.
基于半监督多示例学习的对象图像检索   总被引:2,自引:0,他引:2  
李大湘 《控制与决策》2010,25(7):981-986
针对基于对象的图像检索问题,提出一种新的半监督多示例学习(MIL)算法.该算法将图像当作包,分割区域的视觉特征当作包中的示例,按\"点密度\"最大原则,提取\"视觉语义\"构造投影空间;然后利用定义的非线性函数将包映射成投影空间中的一个点,以获得图像的\"投影特征\",并采用粗糙集(RS)方法对其进行属性约简;最后利用直推式支持向量机(TSVM)进行半监督的学习,得到分类器.实验结果表明,该方法有效且性能优于其他方法.  相似文献   

17.
Semi-supervised outlier detection based on fuzzy rough C-means clustering   总被引:1,自引:0,他引:1  
This paper presents a fuzzy rough semi-supervised outlier detection (FRSSOD) approach with the help of some labeled samples and fuzzy rough C-means clustering. This method introduces an objective function, which minimizes the sum squared error of clustering results and the deviation from known labeled examples as well as the number of outliers. Each cluster is represented by a center, a crisp lower approximation and a fuzzy boundary by using fuzzy rough C-means clustering and only those points located in boundary can be further discussed the possibility to be reassigned as outliers. As a result, this method can obtain better clustering results for normal points and better accuracy for outlier detection. Experiment results show that the proposed method, on average, keep, or improve the detection precision and reduce false alarm rate as well as reduce the number of candidate outliers to be discussed.  相似文献   

18.
一种基于新的条件信息熵的高效知识约简算法   总被引:16,自引:1,他引:15  
分析了在知识约简过程中现有条件信息熵的不足,给出一种新的条件信息熵,由此定义新的属性重要性.将其与基于正区域和基于现有条件信息熵的属性重要性进行比较,结果表明新的属性重要性是一种更准确、更全面的启发信息.以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的高效算法.理论分析和实验结果表明,与基于现有条件信息熵的约简算法相比,该约简算法时间复杂度较低,且在搜索最小或次优约简方面更优.  相似文献   

19.
周献中  李华雄 《控制与决策》2010,25(10):1507-1512
针对粗糙集理论中计算决策表核属性时出现的若干问题,讨论并分析了这些问题产生的原因.在此基础上,给出了不同目标下的广义约简定义,提出了必要区分关系和非必要区分关系等概念,由此给出了一般意义下的分辨矩阵定义.根据广义约简的定义,将已有的改进差别矩阵求核方法与早期Skowron等人提出的经典分辨矩阵求核方法作了对比,证明了两种方法完全相I司.  相似文献   

20.
基于粗糙集和Petri网的随机流网络可靠性评价方法   总被引:2,自引:0,他引:2  
针对随机流网络可靠性建模难的问题,提出一种基于粗糙集和Petri网相结合的随机流网络可靠性评价方法.建立了随机流网络在确定网络状态下的Petri网模型,并利用粗糙集方法求得网络中各边状态对系统状态的重要度;然后以此作为随机流网络的Petri网模型中各变迁的优先因子来控制模型中变迁的激发;最后通过蒙特卡罗仿真求得随机流网络可靠度的估计值.仿真结果表明,该方法是一种计算随机流网络可靠性的有效方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号