首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
属性约简是信息系统中的一个重要操作,而分类是属性约简的基础,且直接在大数据集上进行属性约简往往存在效率低下的问题。故以分类为基础提出了一种基于信息熵的信息系统并行属性约简算法。该算法通过信息熵的计算,在属性约简的同时对原信息系统逐层分解成尽量均匀的子表,从而实现了属性约简的并行计算并缩小了搜索空间。对该算法的时间复杂度进行了分析,实验表明,该算法在效率方面优于传统算法。  相似文献   

2.
基于二进制可辨矩阵的属性约简算法的改进   总被引:11,自引:1,他引:11  
属性约简是粗糙集理论的核心内容之一,信息系统中知识(属性)并不是同等重要的,甚至其中某些知识是冗余的。属性约简是在保持信息系统中知识量(即分辨能力)不变的条件下,删除其中不相关或不重要的知识,现已证明寻找信息系统的最小属性约简是NP-hard问题。解决这类问题的一般方法是采用启发式算法求出最优或次最优约简。对支天云等所给出的二进制可辨矩阵的化简算法进行了改进,并根据属性的分辨能力的大小,提出了一种基于二进制可辨矩阵的思路清晰、实现简便的属性约简算法。通过算法分析表明,该算法是更加高效的。  相似文献   

3.
郭宁  林和  谭婧 《微机发展》2011,(2):98-101
粗糙集和灰色理论在数据挖掘领域各有优点,它们最终目标都是为了发现知识。将粗糙集和灰色系统结合,研究了区间灰色信息系统在优势关系下的约简方法。在现实世界中,属性之间可能存在着一种属性序的关系,将这种属性序关系引入到基于优势关系的灰色信息系统中,给出了两种属性约简的算法:一种基于分辨矩阵的算法,另一种不基于分辨矩阵的算法。较好地适应了不完备信息系统和大数据集信息系统约简。最后通过实例对比,得出两种算法的约简结果是一致的,并分析了各自的适用范围。  相似文献   

4.
粗糙集和灰色理论在数据挖掘领域各有优点,它们最终目标都是为了发现知识.将粗糙集和灰色系统结合,研究了区间灰色信息系统在优势关系下的约简方法.在现实世界中,属性之间可能存在着一种属性序的关系,将这种属性序关系引入到基于优势关系的灰色信息系统中,给出了两种属性约简的算法:一种基于分辨矩阵的算法,另一种不基于分辨矩阵的算法.较好地适应了不完备信息系统和大数据集信息系统约简.最后通过实例对比,得出两种算法的约简结果是一致的,并分析了各自的适用范围.  相似文献   

5.
一种增量式属性约简算法   总被引:1,自引:1,他引:0  
文章基于粗糙集理论提出了一种新的增量式属性约简算法。当信息系统的对象和决策属性不变而不断增加条件属性时,通过该算法可动态地实现属性约简,由该算法得到的属性约简具有一定的实用价值。通过实例验证了该算法的正确性和有效性。  相似文献   

6.
基于改进区分表的核属性约简算法   总被引:1,自引:0,他引:1  
知识约简是一个NP难问题,在众多知识约简方法中,核属性基本上作为属性约简的初始解,这样就能有效地减小约简算法在属性空间中的搜索范围,在一定程度上加速了知识约简的进行.然而,核属性解基本上是利用Hu的分辨矩阵法求得的.结合Hu的分辨矩阵算法,讨论了Hu以及Wroblewaski区分表算法中存在的问题,改进了区分表的定义并结合Ye方法提出了基于区分表核属性约简算法,既克服了分辨矩阵方法的缺陷,又避免了区分表算法中存在的问题.实验结果表明该算法能有效求出决策系统的属性核.  相似文献   

7.
属性约简是粗糙集理论的核心内容之一。论文是继续文献[8]的工作,在变精度集对粗糙集模型的基础上,定义了变精度的重要性算子和变精度的近似约简等概念,并由此给出了一种属性约简的启发式算法。算法既能保证属性约简的准确性,又能增加其灵活性,它可以通过对相似度α和精度β的调节,按照广度优先搜索策略,从条件属性集中逐一删除重要性最小的属性,从而得到一个满足相似度和精度要求的近似约简。同时,它也是完备信息系统的属性约简算法的推广(当α=1,β=0时)。最后通过一个实例,分析说明算法的可行性和有效性。  相似文献   

8.
一种基于粗糙集理论的规则提取方法   总被引:2,自引:1,他引:2  
规则提取是实现智能信息系统的重要环节,也是一个难点。针对信息系统中的规则提取问题,提出了一种基于粗糙集的研究方法,并对规则提取涉及到的属性约简、属性值约简等问题进行了研究。根据粗糙集中的不可分辨关系建立了可辫识向量,以利用可辨识向量的加法法则运算求得核属性以及属性重要性,然后以核属性为基础、属性重要性为启发信息,求得信息表的一个属性约简。在此基础上,利用条件属性与决策属性之间的对应关系,对信息表中的每条规则通过删除冗余属性值来完成信息表的属性值约简,最终实现规则提取。数值实例和试验表明本算法是有效、可行的。  相似文献   

9.
论证在简化的信息系统上进行属性约简的可行性,指出某信息系统属性约简快速算法的计算结果可能含冗余属性,且在时间复杂度计算上存在错误。在此基础上,提出一种基于论域压缩的启发式属性约简算法,将相对支持度作为启发信息,缩小搜索空间,加入二次约简过程以消除冗余属性。实例分析表明,该算法具有较好的约简效果。  相似文献   

10.
王光琼 《测控技术》2019,38(8):54-60
传统的属性约简算法不能适用于动态变化的信息系统。为了对属性集不断动态增加的信息系统进行更高效的属性约简,基于粒计算模型中知识粒化的视角,提出一种知识粒度的增量式属性约简算法。在信息系统中引入知识粒度度量的概念,当信息系统属性集增加时,研究了知识粒度的增量式更新方法,理论分析了这种更新方法的高效性,根据知识粒度的增量式更新提出一种增量式属性约简算法。仿真实验结果表明该算法具有较高的属性约简性能。  相似文献   

11.
针对启发式算法难以获得最小约简的问题,研究最小约简约束下属性之间的排斥特性,提出了针对部分最小约简必要条件的属性排斥矩阵.在此基础上,分别结合典型加法类和减法类启发式约简算法提出两种改进的基于属性排斥矩阵的启发式属性约简算法,采用UCI(加州大学欧义分校)机器学习数据集所进行的测试结果表明,属性排斥矩阵能够全面提高启发式属性约简算法的性能,有利于获得最小约简.  相似文献   

12.
粗糙集理论是一种新的处理含糊和不确定性问题的数学工具,可以有效地分析和处理不完备信息。条件属性约简是粗糙集理论算法研究的重点。在启发式条件属性约简算法的基础上提出了动态条件属性约简算法,算法以一个信息大的属性作为基础,不断添加条件属性,并对新增加的条件属性进行修正,找到约简条件属性,目的为了进行遥感数据的动态分类做基础。文中在VC++6.0开发环境下实现了两种算法,用HSV和Iris数据验证了算法的有效性,并分析了算法的时间和空间复杂度。  相似文献   

13.
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法。该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简。  相似文献   

14.
白鹤翔  王健  李德玉  陈千 《计算机应用》2015,35(8):2355-2359
针对"大数据"中常见的大规模无监督数据集中特征选择速度难以满足实际应用要求的问题,在经典粗糙集绝对约简增量式算法的基础上提出了一种快速的属性选择算法。首先,将大规模数据集看作一个随机到来的对象序列,并初始化候选约简为空集;然后每次都从大规模数据集中无放回地随机抽取一个对象,并且每次都判断使用当前候选约简能否区分这一对象和当前对象集中所有应当区分的对象,并将该对象放入到当前对象集中,如果不能区分则向候选约简中添加合适的属性;最后,如果连续I次都没有发现无法区分的对象,那么将候选约简作为大规模数据集的约简。在5个非监督大规模数据集上的实验表明,所求得的约简能够区分95%以上的对象对,并且求取该约简所需的时间不到基于区分矩阵的算法和增量式约简算法的1%;在文本主题挖掘的实验中,使用约简后的数据集挖掘出的文本主题同原始数据集挖掘出的主题基本一致。两组实验结果表明该方法能够有效快速对大规模数据集进行属性选择。  相似文献   

15.
提出了一种基于覆盖粗糙集理论,利用最大一致块技术进行不完备信息系统约简的方法。在证明利用最大一致块技术生成的相容类构成论域的最简覆盖基础上,利用覆盖粗糙集理论对已利用最大一致块技术进行属性约简的信息系统进行属性值约简,并提出一种新的约简算法。  相似文献   

16.
针对属性约简的推广,采用邻域近似条件熵,建立邻域粗糙集的特定类属性约简及其启发算法。粒化分解决策分类的高层邻域近似条件熵,提取定义特定类的中层邻域近似条件熵并得到上下界与粒化非单调性;提出基于邻域近似条件熵的特定类属性约简,设计启发式约简算法;采用决策表实例与数据集实验进行有效验证。所得结果有利于特定类模式识别的不确定性度量与优化应用。  相似文献   

17.
属性约简的效率是粗糙集等软计算理论的核心问题之一。为了提高约简效率,在分析不可分辨关系和基数排序特点的基础上,提出了一种时间复杂度为O(|C||U|)的求核算法。然后,运用改进的属性重要度作为启发信息,得到一种快速的属性约简算法,时间复杂度为O(|C|2|U|)。最后,通过UCI机器学习库中的一些数据集对算法进行测试,证明了算法对大型的数据集进行属性约简的高效性。  相似文献   

18.
Induction of multiple fuzzy decision trees based on rough set technique   总被引:5,自引:0,他引:5  
The integration of fuzzy sets and rough sets can lead to a hybrid soft-computing technique which has been applied successfully to many fields such as machine learning, pattern recognition and image processing. The key to this soft-computing technique is how to set up and make use of the fuzzy attribute reduct in fuzzy rough set theory. Given a fuzzy information system, we may find many fuzzy attribute reducts and each of them can have different contributions to decision-making. If only one of the fuzzy attribute reducts, which may be the most important one, is selected to induce decision rules, some useful information hidden in the other reducts for the decision-making will be losing unavoidably. To sufficiently make use of the information provided by every individual fuzzy attribute reduct in a fuzzy information system, this paper presents a novel induction of multiple fuzzy decision trees based on rough set technique. The induction consists of three stages. First several fuzzy attribute reducts are found by a similarity based approach, and then a fuzzy decision tree for each fuzzy attribute reduct is generated according to the fuzzy ID3 algorithm. The fuzzy integral is finally considered as a fusion tool to integrate the generated decision trees, which combines together all outputs of the multiple fuzzy decision trees and forms the final decision result. An illustration is given to show the proposed fusion scheme. A numerical experiment on real data indicates that the proposed multiple tree induction is superior to the single tree induction based on the individual reduct or on the entire feature set for learning problems with many attributes.  相似文献   

19.
翟俊海  万丽艳  王熙照 《计算机科学》2014,41(12):148-150,154
在经典粗糙集中,基于重要度的决策表属性约简算法只考虑了决策属性与条件属性之间的依赖度,没有考虑约简中条件属性之间的相关性,由此求出的约简中可能依然包含冗余属性。针对这一问题,提出了一种改进算法,它利用最小相关性和最大依赖度准则求决策表属性约简。与基于重要度的决策表属性约简算法相比,本算法求出的约简包含的属性个数少、冗余小。实验结果显示,本算法优于基于重要度的决策表属性约简算法。  相似文献   

20.
提出了一种基于覆盖粗糙集理论,利用最大一致块技术进行不完备信息系统约简的方法。在证明利用最大一致块技术生成的相容类构成论域的最简覆盖基础上,利用覆盖粗糙集理论对已利用最大一致块技术进行属性约简的信息系统进行属性值约简,并提出一种新的约简算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号