首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
基于属性相似度的属性约简算法   总被引:11,自引:0,他引:11  
为解决粗糙集属性约简算法存在的诸多问题,从属性相似度出发推导出属性相似度与粒度相似度的一致性,进而提出了一种基于属性相似度的属性约简算法,主要包括采用分明矩阵法求条件属性集的约简,核的求取,可省属性的相似度计算和最简约简的求出等步骤,仿真与对比分析表明其计算简便、效果显著。  相似文献   

2.
知识约简是粗糙集研究的内容之一,粒度计算问题结合粗糙集的理论和应用可以解决一些问题.在一个由信息系统构成的多粒度数据集上,利用提出的Seeking Common Ground While Eliminating Differences(SCED)模型和给出的算法,较好地解决了一些多粒度下的属性约简,所给出的实例从时间复杂度上也充分说明了模型和算法的有效性.  相似文献   

3.
阐述了粗糙集理论和信息熵的概念,在此基础上提出了一种基于信息熵的属性约简算法。该算法从相对核的角度出发,将信息熵、条件信息熵和属性的重要度结合运用,优化了算法的结构,同时加快了决策表的运行速度。用CTR和Wine数据集对提出的算法进行了实验验证。结果表明,该算法能获得决策系统的最优属性约简,同时加快了运行速度。  相似文献   

4.
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

5.
针对经典属性约简算法不能有效适应大数据集的问题,通过分析经典属性约简算法的特点,提出了一种改进的基于条件信息熵的属性约简算法.该算法以分类为基础,引入了类分布链表,将条件信息熵和成熟的数据库技术相结合,解决了内存限制问题,优化了算法的结构,同时加快了决策表的运行速度.最后通过实例对算法的有效性和可伸缩性做了分析.实例仿真计算表明,该算法在具有更快的约简速度的同时又不失其准确率.  相似文献   

6.
品类定义是品类管理的第一步,通过引入多值属性来解决品类描述和品类结构划分中存在的不完整性,克服当前在品类管理实践中对某些属性的描述采取简单化处理的现象。提出基于管理信息化条件下对应的合成与分解思路及多种实现方法,能在一个字段中完整地包容属性中的多值,有利于经营者对销售特征的掌握,全面知晓顾客对这些属性的看法和满意度,最终准确把握顾客关键的购买需求。  相似文献   

7.
基于信息增益的属性约简算法   总被引:1,自引:0,他引:1  
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

8.
为了克服属性约简过程中寻找最小属性集算法存在时间复杂度高搜索空间大等不足,把属性抽象为节点,通过蚁群算法搜索得到节点的最少组合,使得其能代替原有的属性节点并保持决策系统的粗糙分类能力.针对蚁群算法初期信息素匮乏,收敛速度慢的问题,将蚁群算法和粗糙集理论融合,采用粗糙集理论的相关算法确定属性核,并将其作为蚁群算法的初始节点.利用蚁群算法的搜索能力,用于最小属性集的搜索.理论分析和实验结果表明,该算法可行有效.  相似文献   

9.
针对Rough Sets理论的属性约简进行了研究.引入了决策属性集相对于条件属性集的条件信息量的概念,证明了条件信息量在属性约简过程中的变化规律是单调递减的,并利用其计算属性集中属性间的相关性,其平均值最小的属性集即为最后属性约简的结果,由此,提出了一种新的基于信息量的属性约简算法.  相似文献   

10.
基于信息量的一种属性约简算法   总被引:35,自引:0,他引:35  
提出了决策属性集相对于条件属性集的条件信息量的概念,证明了其在属性约简过程中的变化规律是单调递减的,并提出了一种新的属性约简启发式算法,该算法的时间复杂度为O(|C|^3|U|^2).通过例子分析,表明该算法是有效的.  相似文献   

11.
作为数据挖掘的重要工具,粗糙集理论被广泛的应用于关系数据库中属性相关性描述、属性集约简、属性重要性度量、规则发现等方面。该文在分析基于信息系统的粗糙集理论的基础上,对基于分辨矩阵的属性约简算法进行了详尽的描述。针对该算法存在的时间和空间性能不理想问题,提出度量单个条件属性对系统概念贡献程度的关联度的概念,以此作为启发式信息对原算法进行改进,得到条件属性的约简。理论分析及实验结果表明该算法具有较好的约简效果及更高的运行效率,为粗糙集理论更广泛地应用于具体的实践提供了一种方法。  相似文献   

12.
一种基于互信息增益率的新属性约简算法   总被引:13,自引:1,他引:13  
为了获得决策系统中更好的相对属性约简,提出了一种基于互信息增益率的属性约简算法.该算法考虑了所选择条件属性与决策属性的互信息,还考虑了所选择属性的值的分布情况,从信息论角度定义了基于互信息增益率的属性重要性度量方法,并以此度量为启发式信息,算法从空集开始逐步将最重要的条件属性加入到选择属性集,直到所选择的条件属性集与决策属性集的互信息等于整个条件属性集与决策属性集的互信息时,算法停止.结果表明,算法能更有效地对决策系统进行约简,同时约简后的对象数目较少.  相似文献   

13.
Pawlak提出的基于属性重要度的约简算法是常用的算法之一,它通过计算等价关系对论域划分的粒度来度量属性的重要度。但用该算法计算每一个属性的重要度时,都要计算不同等价关系对整个论域的划分,计算复杂度非常高。受决策树划分子集思想的启发,对基于属性重要度的属性约简算法进行了改进,提出了一种基于划分子集的属性约简算法。在核属性集形成划分的基础上,通过在核属性中添加非核属性从而形成更细的划分,如此反复。在保持正域不变的框架下,形成最细化分的属性集就是一个约简。理论分析显示该算法减少了求属性约简的计算时间复杂度,提高了求属性约简的效率。  相似文献   

14.
针对大容量数据表构造的区分矩阵过于庞大致使属性约简算法效率低的问题,引入置信度和支持度,提取大型数据库中的高概率事件,重新构造决策数据表,并在构造区分矩阵过程中剔除重复项和包含项,结果使得比较次数减少、存储空间节省、约简效率提高。  相似文献   

15.
一种基于粗糙集的K-means聚类算法   总被引:2,自引:0,他引:2  
对粗糙集进行了相关研究,并提出了一种以粗糙集理论为基础的K-平均聚类算法,该算法以信息表中条件属性和决策属性的一致性原理为基础,应用粗糙集的属性约简算法消除冗余属性,利用各属性重要度确定其权值,在此基础上应用改进的K-平均算法进行聚类分析.该方法的优势在于消除了不重要的属性,赋予了各属性权值,使聚类更有效,更客观.实验结果表明,该方法是有效的.  相似文献   

16.
本研究结合信息熵与粗糙集理论中的属性约简技术,提出了一种新颖的离群点检测算法。这种方法通过在更小的属性子空间去获得相同或相近的离群数据集,使对离群数据的分析更加集中于较小的目标域。该算法对原属性空间进行划分,通过分析计算将具有最大相对熵与负相对势的对象集合判定为离群点集合。为了验证算法的有效性,还在通用数据集上进行了测试,理论分析和实验结果表明该离群点检测算法是有效可行的。  相似文献   

17.
关系积理论及属性约简算法   总被引:3,自引:0,他引:3  
属性约简是粗糙集RS (rough set)理论的重要研究内容.决策表的最小属性约简是NP-hard问题.本文基于集合理论,提出了关系积概念,把决策表的属性约简过程转化为关系积的运算,充分利用关系积的相关性质,提高了关系积属性约简算法的效率.  相似文献   

18.
基于粗集理论的数据约减算法及其改进   总被引:4,自引:0,他引:4  
在分析基于信息系统的粗糙集理论的基础上,详细地描述了一种基于核的约减算法,接着从降低约减算法计算复杂度角度出发,提出度量单个条件属性对系统概念贡献程度的关联度的概念,修改了属性约减算法,并简要计算算法修改前后计算复杂度,实验结果表明,修改后的算法在降低时间复杂度的同时能求出次优属性集约简.  相似文献   

19.
为了拓展综合推理的涵盖范围,建立了基于粗糙集理论的综合推理模型.将综合推理中的综合源和场引入到粗糙集理论的决策系统中. 通过对原始决策系统的分解得到综合源,分解而成的每个决策系统构成一个综合推理的源.在分解得到的综合源中,基于正域的概念,用依赖度和分类质量方法定义了场强,根据属性出现频率,采用差别矩阵定义了场强,并结合信息论,通过互信息、条件熵和互信息增益率定义了场强.分析结果表明,该模型可完成属性约简过程.实现了对粗糙集理论和综合推理理论的融合和成功扩展.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号