共查询到18条相似文献,搜索用时 140 毫秒
1.
一种启发式知识约简算法 总被引:3,自引:0,他引:3
属性约简是Rough集理论中的核心问题之一,找出所有的约简或最小约简是一个NP难题.本文证明了正区域和边界域的一些性质,指出在考虑正区域作为启发信息的同时,还应该考虑在不一致决策表中边界域对约简的影响,综合这两种信息,提出了不一致决策表约简的启发信息.并在此基础上,设计了不一致决策表的启发式约简算法.实验证明,在多数情况下,该算法能够得到决策表的最小或次优约简. 相似文献
2.
3.
一种基于Rough集理论的属性约简启发式算法 总被引:9,自引:1,他引:9
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中属性的最小相对约简,在Rough集理论的基础上构造了一个新的算子,将信息论角度定义的属性的重要性作为启发式信息,来描述在决策表中条件属性所提供的知识对决策属性的影响;并采用宽度优先搜索策略,提出了一种新的属性约简启发式算法.以原始条件属性集为起点并结合算子,通过向属性核的递减式逼近,得到属性的最小相对约简.实例分析表明,该算法能有效地对决策表属性进行约简. 相似文献
4.
在基于Rough集理论的知识发现过程中,减小属性约简复杂度问题是重要研究内容之一。该文分析了基于遗传算法的约简算法,提出了一种在优化初始群体基础上提高算法性能的遗传约简算法。 相似文献
5.
采取一边计算构成等价类的相对分明函数的合取范式,一边通过产生的合取范式与已有的规则集计算新的规则集,得到一种改进的规则学习算法,由于该方法不用生成分明矩阵的中间环节,这样便节省了空间和时间,提高了运行效率,实验结果表明,该算法在效率上较现有算法有明显提高. 相似文献
6.
一种新的启发式知识约简算法 总被引:3,自引:0,他引:3
知识约简是Rough Set理论研究的重要内容.通过分辨矩阵定义了简化分辨函数,然后针对此分辨函数构造了两种操作以及定义了覆盖、最小覆盖等概念,并基于这种操作、概念和相关原理将决策系统的约简问题转化为寻求简化分辨函数最小覆盖的问题;面向最小属性约简定义了基于简化分辨函数的属性重要度,并以此为启发信息,结合已导出的有关最小覆盖的定理构造了一种新的知识约简算法--算法SDFAR.文中,在理论上详细证明了提出算法的完备性并给出了算法的复杂性分析,说明其高效性,对寻找最小约简是相对有效的,这在最后的实验中也得到了验证. 相似文献
7.
约简数据集的支持向量分类机算法 总被引:1,自引:0,他引:1
支持向量机是当前智能计算研究领域的热点之一。基于支持向量机的大样本学习一直是一个非常具有挑战性的研究课题。对于分类问题给出一种基于相似度的约简数据集的方法。给出的新算法大大地减少了训练样本的数目和所求解的支持向量机算法的规模,有效地加快了支持向量机算法的训练速度。仿真实验表明:新算法较为简单、实用。 相似文献
8.
经典Rough集理论是基于完备信息系统的。然而在实际应用中,由于数据存取或数据处理方面的原因,决策表经常是不完备的,即存在缺值。为了处理不完备信息系统,Kryszkiewicz提出了基于容差关系的Rough集模型。在该模型下进行知识约简时,现有的算法一般都采用构造区分矩阵和相应区分函数的方法。该方法虽然可以求得所有约简,然而业己证明这是一个NP-hard问题,因此实践中更为可行的方法是利用启发式搜索算法求出最优或次最优约简。在文中提出属性的重要性定义,并以此作为启发式信息,设计一种完备的知识约简算法。 相似文献
9.
一种粗糙集属性约简算法 总被引:15,自引:5,他引:15
该文针对RoughSet理论的属性约简进行了研究。利用RoughSet和信息论的相关知识,研究了通过可辨识矩阵求得属性约简集,并利用条件熵来计算属性约简集中属性间的相关性,其平均值最小的属性集即为求得的最佳属性约简的结果。实验证明,它可以取得比较理想的效果。最后利用该文的方法给出了对UCI机器学习数据库的例子的约简结果。 相似文献
10.
利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的算法。实验结果表明该约简算法能快速搜索到最优或次优约简。 相似文献
11.
基于决策规则的条件属性支持度和规则支持度,结合Apriori算法思想,本文提出了一种利用决策规则支持度对粗糙集中决策表进行值约简的算法。实例表明该算法可以有效地对决策表进行值约简。 相似文献
12.
13.
属性约简是粗糙集理论研究的核心内容之一,足知识获取的关键步骤.针对大规模数据集,基于决策表差别矩阵属性约简不具备可操作性缺点;以及基于差别矩阵属性频度的约简算法没有考虑到差别矩阵元素中属性个数多少的缺陷.基于差别矩阵元素的基数越小,其属性越重要的思想,按照基数由小到大的顺序,利用矩阵中具有相同基数的矩阵元素的簇集中属性出现的频度,确定属性的重要度,提出一种快速搜索属性约简算法,能快速搜索到属性的最优或次优约简.实验结果表明算法是可行、有效的. 相似文献
14.
15.
基于Rough Set理论的一种属性值约简算法 总被引:2,自引:0,他引:2
属性值的约简是Rough Set理论的核心内容之一。它的口的就是在保持规则集的分类能力的条件下,删除多余属性值,进一步简化规则集。从而,得到最小的知识库。本文针对Rough Set理论中值约简这个重要问题进行了研究,提出了一种利用决策规则质量的属性值约简算法。该算法比现有的值约简算法更简化,并用实验证明了其有效性。 相似文献
16.
粒矩阵属性约简的启发式算法 总被引:1,自引:0,他引:1
属性约简是粗糙集理论一个重要的研究问题.在粗糙集理论上,利用粒计算的思想构建了粒矩阵,提出并定义了粒矩阵相与运算,建立了基于粒矩阵的知识粒化方法,并且给出了粒矩阵属性约简的启发式算法.采用粒矩阵进行属性约简选择最小属性集,跳出了传统属性约简的先求解属性核,再求解最优属性集的方法.理论分析表明了新的算法是可靠有效的,给粒计算属性约简提供一个新的思路,为进一步研究粒计算提供可行的方法. 相似文献
17.
基于核属性依赖的属性约简算法研究 总被引:1,自引:0,他引:1
数据库中的数据往往含有大量冗余或不必要的属性,严重降低了数据挖掘算法的时间效率和算法质量,因此删除数据的冗余属性和无关属性即属性约简就成了数据预处理过程中的主要任务,而粗糙集理论是处理属性约简的一个非常实用的理论工具.在深入研究粗糙集理论的基础上,结合数据库操作知识给出了基于核属性依赖的属性约简新方法.该算法能过滤掉属性集合中的无关属性和冗余属性,从而得到满意的属性约简,该算法复杂度较小.实验结果证明了该算法有效. 相似文献
18.
一种改进的启发式离散化算法及应用 总被引:1,自引:0,他引:1
Nguyen S.H提出的布尔逻辑和粗糙集理论相结合的离散化算法是粗糙集理论中的离散化算法在思想上的重大突破。通过定义分界点来区分Nguyen S.H离散化算法中定义的断点对决策系统的分辨关系是否有贡献,并仅取分界点集作为初始断点集,使得初始断点数目较大幅度地降低,提出了一种改进的启发式离散化算法并应用于一个实际的决策系统的连续属性离散化。应用实例表明改进算法较大程度地减小了算法空间复杂性和时间复杂性,具有正确性和实用性。 相似文献