首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
多标记数据的特征选择是机器学习和数据挖掘领域的重要研究内容,当前对于多标记数据的特征选择研究大多是针对完备性数据,但在许多应用领域中,连续型数值数据较多,且由于诊测成本和隐私保护等因素导致数据往往呈现出不完备性。为解决上述问题,提出了一种面向多标记不完备数据的特征选择算法。该算法将邻域粗糙集模型应用于多标记不完备数据的特征选择,根据邻域阈值求解多标记不完备数据的邻域粒度,并基于邻域粒度给出了度量多标记不完备数据的特征重要性准则,以此设计了面向多标记不完备数据的特征选择算法。最后,通过在Mulan数据集上的实验结果验证了算法的有效性和可行性。  相似文献   

2.
概率差别矩阵与不完备信息系统属性约简   总被引:1,自引:0,他引:1  
闫德勤 《计算机科学》2005,32(8):164-166
差别矩阵的概念是基于粗糙集理论对信息系统进行属性约简的一个重要内容。针对不完备信息系统的属性约简本文提出了一种概率差别矩阵的概念与构造方法,给出了相关的定理。在此基础上提出了一种利用概率差别矩阵对不完备信息系统属性约简的方法,并给出了应用举例。  相似文献   

3.
主动协同半监督粗糙集分类模型   总被引:1,自引:0,他引:1  
粗糙集理论是一种有监督学习模型,一般需要适量有标记的数据来训练分类器。但现实一些问题往往存在大量无标记的数据,而有标记数据由于标记代价过大较为稀少。文中结合主动学习和协同训练理论,提出一种可有效利用无标记数据提升分类性能的半监督粗糙集模型。该模型利用半监督属性约简算法提取两个差异性较大的约简构造基分类器,然后基于主动学习思想在无标记数据中选择两分类器分歧较大的样本进行人工标注,并将更新后的分类器交互协同学习。UCI数据集实验对比分析表明,该模型能明显提高分类学习性能,甚至能达到数据集的最优值。  相似文献   

4.
一种基于差别矩阵属性约简的完备算法   总被引:1,自引:0,他引:1  
李小伟王娜  李永礼 《微机发展》2005,15(11):144-146,150
为获取一个较优的属性约简集,在对粗糙集中基于差别矩阵的属性约简算法研究的基础上,文中提出了一种新的属性约简算法.该算法对由差别矩阵得到的属性差别集进行运算,得到一种集合内元素之间没有包含关系的新集合,在分析该集合性质的基础上,给出针对该集合的一个较优属性约简集.最后对时间复杂度进行了分析,并给出了完备性证明.  相似文献   

5.
应用粗糙模糊度的不完备信息系统属性约简   总被引:1,自引:0,他引:1  
粗糙集理论能有效地处理不精确、不一致、不完整等不完全数据信息,可以对数据信息进行分析和推理,发掘隐含知识,揭示潜在规律.属性约简是粗糙集理论的重要研究课题.在现实生活中,由于各种条件限制,信息的不完备现象广泛存在,限制了经典Rough集理论在一些实际问题中的应用.文中引入粗糙模糊度度量,定义了一种新的知识熵.在此基础上,提出了一种基于信息观下粗糙模糊度的不完备信息系统属性约简算法.通过仿真实验说明了该算法的有效性和较好的时间优越性.  相似文献   

6.
给出一个差别矩阵的属性约简定义,证明该属性约简的定义与广义决策属性约简的定义是等价的,对差别矩阵进行了有效的压缩。在此基础上,为求出不完备决策表的属性约简,设计了一个基于该差别矩阵的不完备决策表属性约简算法,其时间复杂度为O(|C|2|U|2),最后用实例说明了该算法的有效性。  相似文献   

7.
邻域粗糙协同分类模型   总被引:2,自引:0,他引:2  
Pawlak粗糙集理论是一种有监督学习模型,只适合处理离散型数据.但在一些现实问题中存在着大量的连续型数据,并且有标记数据很有限,更多的是无标记数据.结合邻域粗糙集和协同学习理论,提出了适合处理连续型数据并可有效利用无标记数据提升分类性能的邻域粗糙协同分类模型.该模型首先构建了邻域粗糙半监督约简算法,并利用该算法提取两个差异性较大的约简构造基分类器,然后迭代地在无标记数据上交互协同学习.UCI数据集实验对比分析表明,与其他同类模型相比,该模型有较好的性能.  相似文献   

8.
以不完备信息系统为研究对象,对传统粗糙熵及相应知识约简算法的局限性进行了分析;通过引入概率计算公式,重新定义了不完备熵概念,能够更加精确地度量知识的不确定性;利用粗糙熵和不完备熵联合对属性重要性进行了定义.在此基础上提出了优化的知识约简算法,该算法的时间复杂度是多项式的.通过实例说明,该算法比传统的基于粗糙熵的算法能得到更优的最小约简.  相似文献   

9.
属性约简是粗糙集理论重要研究内容之一,然而求取所有约筒与最小约简的时间复杂度为指数级,在大量或海量数据分析时,算法的可行性将面临巨大挑战.文中分析了现在差别矩阵最小约简算法的缺陷,以改进属性频度为启发式信息给出了最小约简快速完备方法.理论分析结果表明,算法的效率得到了极大的改进.  相似文献   

10.
目前,关于不完备决策表的属性约简算法已有不少,其中在很多算法中,其时间复杂度为O( |C|3|U|2).为有效地降低算法的时间复杂度,给出一个差别矩阵的定义和基于差别矩阵属性约简的定义,并证明了该属性约简与基于正区域的属性约简是等价的.生成的差别矩阵无需比较Umeg之间的对象,使差别矩阵得到有效地简化,进一步降低算法的存储空间.在此基础上,利用简化的差别矩阵设计一个快速计算不完备决策表的属性约简的算法,其时间复杂度降为maX{O( |C|2|Upos,||U|),O(K|C||U|)}.(其中K=max{ |Tc(xi)|,xi∈U}).最后用实例仿真说明了新算法的有效性.  相似文献   

11.
张玉红  陈伟  胡学钢 《计算机科学》2016,43(12):179-182, 194
现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流,这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此,面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记数据块作为起始数据块,对未标记数据块首先提取标记数据块与未标记数据块之间的特征集,并利用特征在两个数据块间的相似度进行概念漂移检测,最后计算未标记数据中特征的极性并对数据进行预测。实验表明了算法在分类精度上的优越性,尤其在标记信息较少和概念漂移较为频繁时。  相似文献   

12.
属性约简是粗糙集理论中重要的研究内容之一,是数据挖掘中知识获取的关键步骤。Pawlak粗糙集约简的对象一般是有标记的决策表或者是无标记的信息表。而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据。为此,结合半监督协同学习理论,提出了处理半监督数据的属性约简算法。该算法首先在有标记数据上构造两个差异性较大的约简来构造基分类器;然后在无标记数据上交互协同学习,扩大有标记数据集,获得质量更好的约简,构造性能更好的分类器,该过程迭代进行,从而实现利用无标记数据提高有标记数据的约简质量,最终获得质量较好的属性约简。UCI数据集上的实验分析表明,该算法是有效且可行的。  相似文献   

13.
针对seeded-K-means和constrained-K-means算法要求标签数据类别完备的限制,本文提出了基于不完备标签数据的半监督K-means聚类算法,重点讨论了未标签类别初始聚类中心的选取问题.首先给出了未标签类别聚类中心最优候选集的定义,然后提出了一种新的朱标签类别初始聚类中心选取方法,即采用K-mea...  相似文献   

14.
不完备联系度粗糙集模型的知识约简   总被引:3,自引:0,他引:3       下载免费PDF全文
知识约简是粗糙集理论的重要研究内容之一。在不完备信息系统中,对联系度粗糙集模型的研究比较深入,但极少涉及知识约简问题。该文在进一步改进联系度粗糙集模型的基础上,研究该模型的知识约简。针对改进模型,提出多种知识约简定义,给出了这些约简之间的关系。通过定义初等分辨矩阵和属性重要度,介绍一种分配约简算法。实例分析说明了算法的有效性。  相似文献   

15.
基于粗糙集方法的不完备信息系统的知识推理   总被引:1,自引:1,他引:0  
含空值决策表的分析一直是智能信息处理领域的一个难点,论文讨论基于赋值容差关系的数据不完全的信息系统中的数据处理方法,并用实例说明不完全决策表中属性约简和决策规则的发现方法。  相似文献   

16.
王娇  罗四维  王立 《计算机科学》2012,39(103):635-539
半监督学习是机器学习领域的研究热点。协同训练研究数据有多个特征集时的半监督学习问题。将图表示法引入协同训练,使用多个图结构表示多关系数据。在每个图上进行半监督学习,在多个图之间进行协同学习,使多个图上的学习器对数据的预测一致。创新性地提出一种针对多关系数据的半监督协同训练算法,并从概率角度分析学习过程。在真实数据集上的实验表明,提出的算法处理多关系数据时具有较好的性能。  相似文献   

17.
Rough集(Rough SetS、Rs)理论被广泛应刑于数据分类问题,该文用基于RS的方法从不完备数据集中产生确定和可能的规则集,提出了一种新的规则发现算法,可以同时从不完备数据集中产生规则和估计缺失值,并指出了进一步的研究方向。  相似文献   

18.
田枫  沈旭昆 《软件学报》2013,24(10):2405-2418
真实环境下数据集中广泛存在着标签噪声问题,数据集的弱标签性已严重阻碍了图像语义标注的实用化进程.针对弱标签数据集中的标签不准确、不完整和语义分布失衡现象,提出了一种适用于弱标签数据集的图像语义标注方法.首先,在视觉内容与标签语义的一致性约束、标签相关性约束和语义稀疏性约束下,通过直推式学习填充样本标签,构建样本的近似语义平衡邻域.鉴于邻域中存在噪声干扰,通过多标签语义嵌入的邻域最大边际学习获得距离测度和图像语义的一致性,使得近邻处于同一语义子空间.然后,以近邻为局部坐标基,通过邻域非负稀疏编码获得目标图像和近邻的部分相关性,并构建局部语义一致邻域.以邻域内的语义近邻为指导并结合语境相关信息,进行迭代式降噪与标签预测.实验结果表明了方法的有效性.  相似文献   

19.
为解决不完备信息的偏好决策问题,多种优势关系及其相应的粗糙集模型被提出并证实其实用性. 然而在实际情况中,只要存在缺失值那么无论使用何种方法对比出来的优势关系都存在一定的不确定性. 基于此,本文分析了影响灰度大小的因素,定义了优势关系中灰度和差异系数的概念并给出了计算方法,建立了两对象间进行对比的灰度度量. 提出了基于灰度的优势关系及其粗糙集近似模型. 与广义扩展优势关系和扩展优势关系相比,基于灰度优势关系的粗糙集模型近似分类精度和质量均有提高. 最后通过实例证明了灰度优势关系及其粗糙近似模型的实用性.  相似文献   

20.
本文分析了已有不完备信息系统中可变精度Rough集模型存在的不足,提出了其改进模型:通过引入遗传算法来解决模型中的阈值优选问题,使阈值优选自动化.仿真试验说明了改进模型的有效性和优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号