首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
关联规则衡量标准的研究   总被引:8,自引:0,他引:8       下载免费PDF全文
罗可  吴杰 《控制与决策》2003,18(3):277-280
关联规则采掘是数据采掘中重要的研究课题。针对当前关联规则采掘中可能产生许多无效关联规则的问题,分析其原因,提出在衡量标准中增加有效度,并给出了有效度的定义。根据有效度的大小,将关联规则分为正关联规则、无效关联规则、负关联规则,提出了新衡量标准采相关联规则的算法,并用Visual FoxPro进行了试验。实验表明,新方法能明显减少无效关联规则的数目。  相似文献   

2.
一个基于兴趣度的关联规则采掘算法   总被引:30,自引:0,他引:30  
关联规则是当前数据采掘研究的主要领域之一,获取具有更高价值的规则是该领域的一个研究重点,针对目前大多数采掘算法只能发现正项的关联规则和仅仅将兴趣度作为规则过滤工具的问题,在先前研究的基础上,提出了通过改进有关定义和引进反向项集的概念来进一步发现包含负项的关联规则的思想,并给出了相应的算法,最后,对这个算法给出了一定的评价和实例分析。  相似文献   

3.
用数据查询语言实现关联规则脂掘   总被引:1,自引:0,他引:1  
关联规则采掘具有广阔的应用前景。文章讨论了关联规则的用途,内涵,分析了关联规则采掘的算法,给出了在DBMS平台上用数据查询语言实现关联规则采掘的程序。测试表明,实现的算法对关联规则采掘十分有效。  相似文献   

4.
采掘关联规则的高效并行算法   总被引:33,自引:1,他引:32  
采掘关联规则是数据采掘领域的一个重要问题。文中对采掘关联规则问题进行了简单的回顾,给出了一种提高顺序采掘关联规则效率的方法;分析了已有并采掘关联规则算法的优缺点;设计了一个效率较高的并行采掘关联规则的算法PMAR;并与其它相应算法进行了比较,实验证明,算法PMAR是有效的。  相似文献   

5.
用数据查询语言实现关联规则采掘   总被引:3,自引:1,他引:2  
关联规则采掘具有广阔的应用前景。文章讨论了关联规则的用途、内涵,分析了关联规则采掘的算法,给出了在DBMS平台上用数据查询语言实现关联规则采掘的程序。测试表明,实现的算法对关联规则采掘十分有效。  相似文献   

6.
关联规则采掘综述   总被引:41,自引:5,他引:36  
介绍了关联规则采掘问题的研究情况,对一些典型采掘算法进行了分析和评价。指出了关联规则衡量标准的不足,展望了关联规则采掘的未来研究方向。  相似文献   

7.
数据集中的冗余属性会降低数据采掘结果的解释能力及精度。该文介绍了在非项目集类型的数据集中采掘聚类关联规则的基本原理,并利用RoughSet理论对属性间的归纳依赖关系进行了分析,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系的算法,使采掘出的关联规则的精度及解释能力都达到令人满意的水平。  相似文献   

8.
基于大型数据仓库的数据采掘:研究综述   总被引:162,自引:3,他引:162  
胡侃  夏绍玮 《软件学报》1998,9(1):53-63
本介绍了数据采掘技术的总体研究情况,包括数据采掘的定义,与其他学科的关系,采掘的主要过程,分类和主要技术手段,作为例子介绍了关联规则采掘的研究,同时介绍了一些原型系统和商业产品以及主要应用领域,指出了数据采掘研究的挑战性以及目前的局限性。  相似文献   

9.
数据仓库的时态关联规则的描述   总被引:1,自引:1,他引:1  
该文从时态型概念出发给出了有限个属性在时态型上描绘的不同状态时态事件空间,定义了事件之间的时态关联规则,由此导出了5种不同的具有一定意义的时态关联规则,这些时态关联规则具有普遍的理论意义,可以用于商品销售、股票价格等等数据仓库中的数据采掘问题。  相似文献   

10.
多策略通用数据采掘工具MSMiner   总被引:6,自引:0,他引:6  
介绍了一种多策略通用数据采掘工具MSMiner的设计与实现。MSMiner建立在数据仓库之一,采用面向对象的方法描述关于数据源、采掘算法、采掘步骤和用户的元数据,该系统集成决策树、关联规则、传统统计分析、聚类分析、神经网络和可视化等多种数据采掘算法,以任务模型的形式生成和执行数据 采掘及决策支持任务。其特点是支持数据库、数据仓库、文本以及Web页面等形式数据源,可以动态地添加采掘算法,对数据和采掘策略的组织灵活有效,具有很好的可扩充性和通用性。  相似文献   

11.
关联规则在空间数据挖掘中的研究   总被引:2,自引:0,他引:2  
在智能化、集成化的空间数据应用领域中,空间数据挖掘是一门很重要的技术,而关联规则分析是空间数据挖掘的主要方法之一。文章基于数据挖掘中的关联规则分析方法,提出不同于一般数据挖掘的算法,设定兴趣度量,并通过将项的概念泛化为空间谓词,事务的概念泛化为邻域,关联规则的概念泛化为同位规则,发现多种形式的有效规则,并用逻辑语言或类SQL语言方式描述规则,以使空间数据挖掘趋于规范化和工程化。最后进行了实评。  相似文献   

12.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

13.
基于确信因子的有效关联规则挖掘   总被引:1,自引:0,他引:1  
通过对现有的关联规则算法分析与研究发现,生成的关联规则具有相大的冗余性,且可能是无趣的,甚至是虚假的,为此人们主要提出了兴趣度作为有效规则评判标准。该文在先前研究的基础上,以确信因子为基础,提出确信度来使规则的有效性判断更加客观、合理。同时在算法中引入规则取舍,提高了挖掘有效规则的效率。  相似文献   

14.
关联规则挖掘是数据挖掘领域中的重要研究内容之一。然而,传统的基于支持度-可信度框架的挖掘方法可能会产生大量不相关、甚至是误导的关联规则。针对现有关联规则挖掘的评价标准存在的问题,提出在评价标准中增加兴趣度,并给出了兴趣度的定义和基于兴趣度的关联规则挖掘算法。利用兴趣度将关联规则分为正关联规则和负关联规则,从而可以用算法挖掘带有负项的关联规则。实验结果分析表明,在传统挖掘方法的基础上引入兴趣度,可以有效地减少正关联规则的规模,产生有意义的负关联规则。  相似文献   

15.
关联规则挖掘是经典的数据挖掘方法,越来越多的企业都把它看作是必不可少的战略分析工具。当前关联规则挖掘方法得到的规则过多,令用户在运用时难以理解,因此研究关联规则集的约简方法具有应用价值。研究了数据库模式中关键字包含的主属性对基于Apriori算法的关联规则挖掘产生的关联规则的影响,即部分函数依赖会导致关联规则挖掘的数据集中冗余信息的频繁出现,并产生没有实际价值的关联规则,识别并消除这样的规则就能实现规则集的约简。求全部主属性如同求所有候选关键字问题都是NP难题,因此提出了一种基于一个候选关键字进行验证的算法来判定主属性,从而完成基于主属性判定的关联规则挖掘约简算法的设计与实现,并在最后的实验中验证了该算法的有效性。   相似文献   

16.
基于数据挖掘的多策略研究生教育课程成绩分析方法研究   总被引:1,自引:0,他引:1  
本文对研究生教育中的课程考试成绩数据进行了深入分析,提出了一种成绩综合评定回归模型。该模型用数据挖掘中的关联规则分析方法来分析课程之间的相关性,引入了兴趣度来减少无用的规则,并对兴趣度进行了数学分析,最后对某专业的成绩进行了实证分析。  相似文献   

17.
针对单一层次结构实现规则提取具有规则提取准确性不高、算法运行时间长、难以满足用户使用需求的问题,提出一种基于改进多层次模糊关联规则的定量数据挖掘算法。采用高频项目集合,通过不断深化迭代的方法形成自顶向下的挖掘过程,整合模糊集合理论、数据挖掘算法以及多层次分类技术,从事务数据集中寻找模糊关联规则,挖掘出储存在多层次结构事务数据库中定量值信息的隐含知识,实现用户的定制化信息挖掘需求。实验结果表明,提出的数据挖掘算法在挖掘精度和运算时间方面相较于其他算法具有突出优势,可为多层次关联规则提取方法的实际应用带来新的发展空间。  相似文献   

18.
实用关联规则挖掘算法的研究和实现   总被引:4,自引:0,他引:4  
关联规则挖掘是数据挖掘的主要方式之一。如何挖掘实用、有趣的关联规则已引起了众多学者的注意, 由于至今没有形成一个统一的标准,本文从删除冗余规则和引入“相关度”这个概念两个方面对实用关 联规则的挖掘算法进行了初步研究,最后对挖掘算法的运行状况进行了比较和分析。  相似文献   

19.
序列模式挖掘是指从序列数据库中寻找频繁子序列作为模式的知识发现过程。本文将序列模式挖掘应用于教学管理,对学生成绩样本数据按照序列数据库模式进行建模和数据挖掘,得出置信度大于65%的时序关联规则3条。实验结果表明,将序列模式挖掘应用于教学管理,对相关课程成绩进行数据挖掘是可行的,发现的时序关联规则对学校的教学管理和学生学业促进有一定的实际指导意义。  相似文献   

20.
在关联规则挖掘中,通常使用最小支持度和最小置信度两个门限来衡量一条规则是不是一个强规则。本文对最小置信度这个参数的实际意义,从理论和实践上进行了分析研究和探讨,发现使用最小置信度进行限制不仅所挖掘出的规则质量较低,还有可能遗漏一些具有重要价值的规则,进一步提出提升率比置信度更能反映实际情况,在关联规则挖掘中改用最小支持度和最小提升率作为衡量准则,其结论更加准确,意义也更明确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号