首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 953 毫秒
1.
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

2.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

3.
属性约简,即在保持知识库的分类或决策能力不变的条件下,删除其中不相关或不重要的属性,是Rough set理论的核心研究内容之一.决策表属性重要性度量方法是决定属性约简算法性能的重要启发式信息.合理的属性重要性度量方法,将有助于提高启发式搜索算法的效率和优化效果.针对基于分辨矩阵的属性重要性度量的缺陷,提出了广义特征矩阵概念,并在分析其性质的基础上,建立了一种新的基于广义特征矩阵的属性重要性分层度量方法,该方法不需要计算属性重要性的权值而直接给出重要性的排序,具有分辨能力强,度量准确的特点,对决策表的属性约简和知识荻取有重要应用价值.  相似文献   

4.
针对基于邻域粗糙集属性重要度约简算法在某些决策表中约简正确率下降等问题,结合基于等价关系下的分辨矩阵知识,定义一种邻域决策系统下的分辨矩阵,邻域分辨矩阵由能够分辨不同邻域对象的条件属性子集组成。根据条件属性在邻域分辨矩阵中的占比提出一种属性重要度的度量方法,以新的重要度作为启发性因子,设计一种邻域决策系统下属性重要度启发性约简算法。该算法以核属性集作为初始集合,依次选择重要度大的属性加入到核集,直至找到最小属性约简时,算法终止。实例分析和UCI数据集试验结果表明,与基于属性依赖度的约简算法相比,该算法能够更有效地找到最小属性约简集,并且可以有效减少计算工作量,证明了算法的有效性和可实用性。  相似文献   

5.
模糊信息表决策规则获取与属性约简方法   总被引:2,自引:0,他引:2  
将粗糙集方法用于模糊信息表上的规则获取和属性约简, 在包含度概念的基础上, 定义了齐次包含度.对两类模糊信息值的信息表, 条件属性是离散值,而决策属性是模糊的模糊决策信息表和条件属性与决策属性均为模糊的模糊信息表, 采用齐次包含度研究了条件属性在决策属性中的包含关系, 得到了包含度意义下模糊决策信息表的属性约简判定定理和决策规则获取方法. 给出了模糊条件属性的所有可能组合, 研究了模糊组合属性在模糊决策属性中的包含关系, 提出了最大属性协调集的概念,建立了在最大协调属性集下的模糊信息表属性约简和决策规则获取的算法步骤, 并通过算例演示了模糊决策规则获取和属性约简的过程, 从而为模糊信息表决策规则获取与属性约简提供了一类算法.  相似文献   

6.
遗传算法信息熵结合属性约简算法研究   总被引:1,自引:0,他引:1  
为了获得决策系统中属性最小相对约简,将信息论角度定义的属性重要性度量作为启发式信息引入遗传算法,提出了一种启发式遗传算法,通过构造一个新的算子来引入启发式信息,使得选择的属性子集的分类能力不变.该算子体现了一种利用启发式信息的局部搜索技术,使得算法既保持整体优化特性,又具有较快的收敛速度,从理论上对算法作了分析,对新算子所能选择属性子集的分类能力不变作了证明,最后的实例表明,该算法能有效地对决策系统进行最大程度的约简.  相似文献   

7.
作为数据挖掘的重要工具,粗糙集理论被广泛的应用于关系数据库中属性相关性描述、属性集约简、属性重要性度量、规则发现等方面。该文在分析基于信息系统的粗糙集理论的基础上,对基于分辨矩阵的属性约简算法进行了详尽的描述。针对该算法存在的时间和空间性能不理想问题,提出度量单个条件属性对系统概念贡献程度的关联度的概念,以此作为启发式信息对原算法进行改进,得到条件属性的约简。理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率,为粗糙集理论更广泛地应用于具体的实践提供了一种方法。  相似文献   

8.
基于粗集理论的约简算法   总被引:5,自引:0,他引:5  
在基于属性重要性和基于分辨矩阵两种算法的基础上,提出了一种同时满足属性重要性和频度的启发式约简算法RedFreSigni。该算法的基本思想是:以属性的核为基础,把核和用户偏好集同时作为属性近似约简的一部分,以频度作为选择属性的启发信息可同时生成计算属性的频度信息与不可分辨矩阵,减少了计算时间。在此基础上进而提出了基于规则支持度和置信度的决策挖掘算法,该算法能有效提取出用户感兴趣的规则。  相似文献   

9.
提出了决策属性集相对于条件属性集的条件信息量的概念,证明了其在属性约简过程中的变化规律是单调递减的,并提出了一种新的属性约简启发式算法,该算法的时间复杂度为O(C3U). 通过例子分析,表明该算法是有效的.  相似文献   

10.
多值RS理论中的属性约简算法   总被引:6,自引:0,他引:6  
从信息论角度对信息系统中的属性重要性进行了度量,在此基础上提出了一种多值RS理论中的属性约简算法,它以一种新的形式的信息熵为启发式信息,减小了知识约简过程中的搜索空间. 实验分析表明,该算法能得到信息系统的最小约简.  相似文献   

11.
针对ID3算法用信息增益作为在各级非叶节点上选择属性的标准的局限性,结合统计学独立检验思想,给出一种新的属性依赖性和重要性定义,以新的属性重要性为启发式信息设计决策树规则提取算法。实例分析的结果表明,该算法能提取更为简洁有效的决策规则。  相似文献   

12.
基于粗集理论的数据约减算法及其改进   总被引:4,自引:0,他引:4  
在分析基于信息系统的粗糙集理论的基础上,详细地描述了一种基于核的约减算法,接着从降低约减算法计算复杂度角度出发,提出度量单个条件属性对系统概念贡献程度的关联度的概念,修改了属性约减算法,并简要计算算法修改前后计算复杂度,实验结果表明,修改后的算法在降低时间复杂度的同时能求出次优属性集约简.  相似文献   

13.
Iterative Dichotomiser version3(ID3)算法是数据挖掘中经典的决策树分类算法,其核心是分裂训练集属性的选择标准,即分裂前后的信息增益量最大,用该标准选择属性时对于取值较多的属性具有较强依赖性。剖析了ID3算法存在的不足并加以改进,引入了属性关注度,提出了改进算法AAID3算法。实验表明改进算法对原ID3算法的取值偏向问题有所克服并使分类更加准确,决策树更加简明。  相似文献   

14.
粗糙集理论在关键功能零件识别中的应用   总被引:1,自引:0,他引:1  
关键功能零件的识别可以提高装配体模型检索的效率并提高重用水平,同时为自主设计提供关键参考信息.为降低人为因素的影响和评价的主观性,本文提出了一种基于粗糙集理论的关键子装配功能零件的自动识别方法,利用装配体模型自身数据对功能零件的排序过程进行驱动.分析、讨论复杂装配体中零件类型与零件之间的装配连接关系,构建了基于复杂网络的装配体模型;提取各零件节点的拓扑结构层和零件属性层数据及零件类型作为条件属性和决策属性;使用基于动态层次聚类的算法对零件决策信息表进行离散化处理,并利用基于属性重要度的启发式约简算法进行知识挖掘,消除冗余条件属性,获得属性约简集及其相应的属性权重;通过综合评价形成了具有关键功能的子装配零件重要度排序.以蜗轮蜗杆减速器模型为例验证本文算法,结果表明:最终的排序结果与专家打分法的结果一致,而本文方法的整个识别过程依靠装配体模型数据自身驱动,降低了主观因素影响,更具有客观性和普适性.  相似文献   

15.
针对Rough Sets理论的属性约简进行了研究.引入了决策属性集相对于条件属性集的条件信息量的概念,证明了条件信息量在属性约简过程中的变化规律是单调递减的,并利用其计算属性集中属性间的相关性,其平均值最小的属性集即为最后属性约简的结果,由此,提出了一种新的基于信息量的属性约简算法.  相似文献   

16.
一种基于粗糙集的K-means聚类算法   总被引:2,自引:0,他引:2  
对粗糙集进行了相关研究,并提出了一种以粗糙集理论为基础的K-平均聚类算法,该算法以信息表中条件属性和决策属性的一致性原理为基础,应用粗糙集的属性约简算法消除冗余属性,利用各属性重要度确定其权值,在此基础上应用改进的K-平均算法进行聚类分析.该方法的优势在于消除了不重要的属性,赋予了各属性权值,使聚类更有效,更客观.实验结果表明,该方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号