首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于粗集理论和神经网络的集成化数据挖掘方法研究   总被引:8,自引:0,他引:8  
为了从大型数据库中获取有用的知识,本文提出了一种基于粗集理论和神经网络的集成化数据挖掘方法。论文以所提出的研究框架为基础,首先给出了一种改进的粗集属性约简的算法和消除冗余属性的方法,进而采用面向对象的概念泛化进一步对数据库进行属性约简,最后用相似权值法得到产生式规则,并将所得规则用决策树来表示,通过一个完整的应用实例演示了本文方法,证实了其有效性。  相似文献   

2.
印勇  田逢春 《计算机测量与控制》2002,10(11):759-761,770
利用粗集理论分析了关系数据库中属性间的因果关系,研究了从关系数据库中挖掘规则的方法,对该方法中条件属性的简化、提取规则的最小简化策略进行了详细讨论,给出了相应的算法。为从数据库中进行知识获取提供了一种新的途径。  相似文献   

3.
一种实值属性信息系统的粗集约简方法   总被引:2,自引:0,他引:2  
本文研究应用粗集理论对实值信息系统属性进行约简的方法,对实值属性信息系统进行约简的根本问题是如何对实值属性离散化,通过对离散化方法与属性约简的关系进行研究,提出实值属性离散化的一种自动确定属性类别的方法,并结合粗集理论给出了对实值属性信息系统约简的算法,用所提出的算法进行了实验,并给出了实验结果。  相似文献   

4.
基于粗集理论的Null值估算方法研究   总被引:1,自引:0,他引:1  
刘业政  杨善林 《计算机工程》2001,27(10):41-42,45
在数据库管理系统中,空值(Null)在所有非主码属性中都可能出现。粗集数据分析不同于其它知识发现方法,特别大模型假设方法的一种方法。文章通过扩展粗集理论,研究了空值的估算方法。  相似文献   

5.
一种基于粗集的欺诈风险分析方法   总被引:2,自引:0,他引:2  
文章利用粗集理论中的特征属性约简方法来分析和研究欺诈风险,提出了一种基于粗集的欺诈风险分析方法,并通过一个信用卡欺诈的分析实例对该算法进行了检验。实验结果表明,在保证分类质量基本不变的情况下,该算法是有效的,它能找出引发欺诈行为的主要特征属性,帮助管理者及时、准确地预测各种可能发生的欺诈风险。  相似文献   

6.
粗集结合决策树的一种数据挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
决策树是一种重要的数据挖掘方法,本文将决策树的基本建树思想ID3算法与对象决策属性化简的粗集理论相结合,得到一种新型的决策树建树方法。通过实例证明了该方法的效率有所提高,使挖掘的效果更简单、更容易理解。  相似文献   

7.
一种基于粗集理论的属性约简改进算法   总被引:11,自引:0,他引:11  
何国建  陶宏才 《计算机应用》2004,24(11):75-76,80
利用粗集理论中属性的依赖度和重要度性质,提出一种对数据属性进行约简的改进算法,对该算法进行分析,并运用一个简单的例子对该算法的有效性进行验证。  相似文献   

8.
经典粗集理论给出了不可识别、上近似、下近似、简式和核等概念,其核心思想是运用条件属性集导致的知识粒子来近似决策属性集导致的知识粒子,进而推导出规则。这些知识粒子的实质是根据存在于属性值问的等价关系得到的,而事实上可能存在某些属性,其属性值内部存在序关系,与其它某属性间存在语义关系,这样的属性称为标准。本文所研究的粗集方法,考虑标准所携带的这些信息,推导出含有序信息的规则,并探讨使推导的规则更加完全和一致。本文给出了含序粗集方法(CORS)的定义、数据分析以及规则生成方法,并提出了一种更加合理的质量近似公式以及生成规则的四条原则。  相似文献   

9.
一种基于粗集理论的遗传分类算法   总被引:1,自引:0,他引:1  
姚前  陈舜  谢立  张军 《计算机科学》2008,35(1):198-201
本文提出了一种基于粗集理论的遗传分类算法,该算法可以无需任何辅助信息,只根据数据自身提供的信息对数据进行简化,提取有用的特征,并求得相应的规则.同时,还提出了一种基于属性重要度的分辨矩阵简化方法,该方法可提高对条件属性的约简效率.  相似文献   

10.
基于粗集理论的权重确定方法   总被引:17,自引:1,他引:17  
利用属性重要度等概念,给出了一种基于粗集理论确定属性权重的方法及其具体操作步骤。通过这种方法,决策者可以通过经验因子的选取来调整客观权重和主观权重所占的比例,使权重的确定更加合理。  相似文献   

11.
以分类为基础提出一种基于条件熵的决策表属性约简算法。通过条件熵的计算在属性约简的同时将原决策表逐层分解成相对于决策属性来说尽量均匀的子决策表,从而缩小了数据规模;随后对算法的时间复杂度进行了分析;实验表明,该算法在效率方面优于传统算法。  相似文献   

12.
采用粗糙集理论中的属性重要度作为挑选测试属性的指标来构造决策树,形成了一种新的决策树分类算法S_D_Tree,在计算挑选测试属性的时间复杂度为O(|C||n|)。实验结果表明,该算法可以构建一个较简洁的决策树,与C4.5算法相比较,具有更好的预测准确率。  相似文献   

13.
科学地形成系统的综合评价指标体系--Rough集的应用   总被引:5,自引:0,他引:5  
本文提出了基于Rough集的Rough决策规则,并以此为理论讨论了对评价指标体系的指标属性进行简化,从而科学地形成综合评价指标体系。  相似文献   

14.
当信息系统的对象和决策属性不变而不断增加条件属性时,为了获得该系统的最小约简属性,一般方法是对决策表的所有数据进行重新计算,很显然这种方法不可取。在粗糙集理论的基础上,给出了过渡相对差异比较表的定义,提出一种新的增加条件属性的最小约简算法。实例说明:该算法节省了大量的时间和空间的资源,并且结论与传统的算法得到的属性最小约简的结论是一致的,所以该算法具有一定的适用价值。  相似文献   

15.
基于粗糙集理论对推理通道问题进行了研究。通过采用属性约简和属性值约简方法对数据库中的数据进行处理。在属性值约简基础之上,采用一种改进算法找出了数据库中推理规则集。进一步,将推理规则集中属性频率高的属性安全级别提高至决策属性的安全级别,从而消除推理通道。最后通过一个实例表明提出的消除通道算法是有效的。  相似文献   

16.
基于信息熵的一种属性约简算法   总被引:5,自引:3,他引:2  
文章针对Rough Set理论的核心内容之一属性约简进行了研究。结合信息论的有关知识,研究了在属性约简过程中决策属性集相对条件属性集的条件熵的变化规律,在此基础上提出了新的属性约简算法。实验分析表明,在多数情况下这种算法都能够得到决策表的最小约简,同时还对算法复杂度做了简单的分析。  相似文献   

17.
针对粗糙集理论只能处理离散数据的局限,提出了基于决策的剥离式连续属性离散化方法,一改传统的候选断点集合的获取方法,直接通过分析连续属性在各决策类的取值范围和计算属性重要度,完成对连续属性的初步离散.此外,本文提出候选断点集的推移原则,可逐步减小候选断点集的范围.由于每次都是针对尚不能明确分类的样本进行细化,因此随着候选断点集的减少和明确分类样本的增加,系统能够迅速收敛,并且离散化后的决策表总是相容的,这与目前很多离散方法不考虑决策相容性相比,能够最大限度地保留系统的有用信息.本文提出的离散化方法是领域独立的,不需要领域知识,可应用于不同领域的连续属性的离散化.  相似文献   

18.
利用覆盖算法对数据进行处理,得到论域U的一个划分,定义一种基于覆盖的条件信息熵,由新的条件信息熵定义新的属性重要性,并证明了对于一致决策表,它与代数定义下的重要性是等价的。以新的属性重要性为启发信息设计约简算法,并给出计算新的条件信息熵的算法。实验结果表明该约简算法能快速搜索到最优或次优约简。  相似文献   

19.
康猛  蒙祖强 《计算机应用》2022,42(2):449-456
基于区分矩阵的传统属性约简方法具有直观易理解的优点,但时间和空间复杂度都很高,当数据规模较大或条件属性较多时,会无法快速得到约简结果.为解决该问题,在区分关系的基础上构造了条件区分能力来进行属性选择,提出一种基于条件区分能力的属性约简算法.而为了进一步加快属性重要性的计算、提高约简效率,依据大数定律中频率的稳定性,通过...  相似文献   

20.
为了获得决策表中更好的属性约简,提出一种信息增益引导的蜂群优化算法;该算法以属性的信息熵为基础构造条件属性与决策属性间的互信息,用待选条件属性引起的信息增益作为引导蜜蜂搜索的启发信息,最终求得属性约简集;对UCI数据库多个数据集的测试结果表明,与其它基于群智能的属性约简算法相比,该算法获得最小属性约简的机率提高到90%以上,同时较对比算法的计算时间少耗费至少10%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号