共查询到10条相似文献,搜索用时 46 毫秒
1.
高效性和可扩展性是多关系数据挖掘中最重要的问题,而提高算法效率的主要瓶颈在于假设空间,且用户对分类的指导会在很大程度上帮助系统完成分类任务,减少系统独自摸索的时间。针对以上问题提出了改进的多关系决策树算法,即将虚拟连接元组传播技术和提出的背景属性传递技术应用到多关系决策树算法中。对改进的多关系决策树算法进行了理论证明,并且对多关系决策树算法和改进的多关系决策树算法进行比较实验。通过实验可以得出,当改进的多关系决策树在搜索数据项达到背景属性传递阈值时,改进的多关系决策树算法的效率相对很高且受属性个数增加(或 相似文献
2.
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能完成单一关系中的模式发现,多关系数据挖掘能够从复杂结构化数据中发现涉及多个关系的复杂模式。该文综述了多关系数据挖掘的研究状况。首先分析了多关系数据挖掘领域发生的原因和背景,其次总结了多关系数据挖掘研究的一般方法,然后介绍、分析了最具代表性的多关系数据挖掘算法。最后,总结了多关系数据挖掘将来发展需重点解决的问题和面临的挑战。 相似文献
3.
4.
多关系数据挖掘是借鉴ILP技术,并结合机器学习方法所提出的数据挖掘新课题。多关系关联规则是多关系方法在概念描述任务中最具代表性的研究方向之一,此类方法在发挥多关系方法的模式表达能力与利用背景知识能力的同时,借鉴成熟的关联规则方法的思想与优化策略,取得了较高的性能与表达复杂模式的能力,同时在面向复杂结构数据的应用中获得了较好的效果。在简述多关系方法的基础上,通过分析与比较目前具有代表性的多关系关联规则算法,总结了各算法的优势与不足,并指出了该领域目前的主要热点问题。 相似文献
5.
6.
基于S-CART决策树的多关系空间数据挖掘方法 总被引:1,自引:0,他引:1
针对空间数据关系复杂的情况,提出了一种改进的多关系数据挖掘结构分类与回归树(S-CART)算法,该算法首先利用空间关联索引表抽取不同主题图层之间的关系原子命题,然后基于逻辑谓词创建多关系二叉决策树,抽取空间关联规则,同时基于我国湖北大冶部分地区土壤污染数据验证算法的有效性。 相似文献
7.
频繁模式发现是数据挖掘的重要任务之一。现实数据通常存储于由多个关系组成的关系数据库中。传统的频繁模式发现方法只能直接完成单一关系中的模式发现,如果要完成多关系数据的挖掘,会产生操作复杂性和信息丢失等问题。多关系数据挖掘是当前数据挖掘研究中快速发展的重要领域之一。多关系频繁模式发现方法能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。本文首先归纳多关系频繁模式发现方法的发生历史背景,其次分析总结多关系频繁模式发现方法,最后提出了多关系频繁模式发现将来发展需重点解决的问题和面临的挑战。 相似文献
8.
多关系数据挖掘的研究领域涉及多个学科,它在由多张表构成的关系数据库中进行知识发现。遗传算法是模拟生物的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。该文将遗传算法应用于多关系数据挖掘,组合使用Apriori方法可从多张表中高效地挖掘出有意义的关联规则。 相似文献
9.
多关系群体挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的群体挖掘方法是假定网络中只有一种关系,并且挖掘结果与用户需求无关。但现实中的社会网络中存在着多种关系。基于用户查询,不同的关系表现出不同的重要性。分析了多关系群体挖掘中关系提取的问题,提出一种新算法对满足用户期望的关系进行最优线性合并。利用获得的合并关系提高群体挖掘的精准性。 相似文献
10.
多粒度粗糙集是一种重要的多粒度数据挖掘模型。为了对不完备信息系统中等价类重叠部分的定量信息进行挖掘,提出一种多阈值的量化容差关系程度多粒度粗糙集模型。首先将描述等价类重叠信息的程度多粒度粗糙集模型与处理不完备信息系统的量化容差关系进行结合,提出量化容差关系的程度多粒度粗糙集模型,然后在该模型的基础上,为每个粒度设定与数据相适应的阈值,提高了量化容差关系程度多粒度粗糙集模型的灵活性,增加多粒度数据挖掘的性能。UCI数据集的实验结果表明,本文所提出的粗糙集模型具有较好的分类效果和理论的可行性。 相似文献