首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为了减少并行挖掘关联规则过程中产生的网络流量及同步次数,提高挖掘效率,在Tree-DM算法的基础上,提出了不生成候选项目集的并行关联规则挖掘算法Ptree-DM。给出了Ptree-DM算法的执行示例,并对该算法的效率进行了分析和讨论。  相似文献   

2.
逆向启发式开采最大频繁项目集   总被引:1,自引:1,他引:0  
杨君锐 《计算机工程》2004,30(14):116-118
关联规则是当前数据挖掘研究的主要领域之一。发现频繁项目集是关联规则数据开采中的关键问题。该文提出了一种基于最夫频繁项目集的逆向开采算法IDMFI(inverse discovery maximum frequent itemsets),该算法利用频繁项目集的有关特性作为启发信息,采用逆向(即自顶向下)的搜索策略,能够大大减少候选项目集的生成,从而显著地提高了开采效率。  相似文献   

3.
快速开采最大频繁项目集   总被引:95,自引:3,他引:95  
路松锋  卢正鼎 《软件学报》2001,12(2):293-297
发现最大频繁项目集是多种数据开采应用中的关键问题,提出一种快速开采最大频繁项目集的算法DMFI(discovery maximum frequent itemsets), 该算法把自底向上和自顶向下的搜索策略进行了合并。通过其独特的排序方法和有效的剪枝策略,大大减少了修选项目集的生成,从而显著地降低了CUP时间。  相似文献   

4.
基于动态交易项目集的关联规则更新   总被引:2,自引:0,他引:2  
张继福  刘静  张荣国  谭瑛 《计算机工程》2000,26(7):64-65,71
该文在交易数据库和最小支持度不变条件下,当用户动态地增加或删除交易项目集中的某些交易项目时,充分利用了交易项目集改变前已采掘出的频繁模式集,提出了两种关联规则的快速更新算法lzi-ar和Dzi-ar,经实验分析表明,该地关联规则的更 可行的和高效的。  相似文献   

5.
一种用Visual FoxPro求频繁项目集的方法   总被引:4,自引:0,他引:4  
罗可  吴建华  吴杰 《计算机工程》2001,27(5):36-37,94
采掘关联规则是数据采掘领域的一个重要问题,依据Apriori算法,提出了一种用Visual FoxPro求频繁项目集的方法,并用Visual Foxpro编写了求1-6项目频繁集的程序。  相似文献   

6.
快速开采最大频繁项目集   总被引:5,自引:1,他引:5  
对Pincer-Search进行了改进,提出了一种新的发现最大频繁项目集的WDMFS算法。由于WDMFS算法采用了位阵存储技术和自底向上、自顶向下双向搜索策略,从而进一步提高了算法的效率,显著降低了系统的I/O成本和CPU时间。  相似文献   

7.
发现频繁项目集所关联的事务集是十分有意义的,它能使人们了解频繁项目集是由哪些顾客的购买行为所引起的。文章首先定义了事务树及其相关操作,在此基础上,设计了一种能在挖掘频繁项目集的同时发现项目集所在事务集的算法(FS-TS_DM),该算法具有仅需扫描一次事务数据库的特点。另外,还定义了“分散度”指标,用于指导“真频繁项目集”的挖掘。  相似文献   

8.
本文在介绍数据开采基本知识的基础上提出了一个通用的开采机模型,并对其各模块的功能做出描述,针对目前许多开采大型数据库中的关联规则高效算法大多是在各自单独的领域内进行算法的理论研究与探讨的问题,本文在研究了两种高效的关联规则开采算法:最大频繁项目集算法FID(Frequent Itemsets Discovery),增量式更新算法IUA(Incremental Updating Algorithm)后,将以上算法综合并在计算机上实现,作为比较同时给出了Aprioiri(经典的关联规则开采算法)的实现。文中为了避免负面示例的问题,还引入了兴趣工的概念,并在系统中实现。  相似文献   

9.
基于多交易项目子集的并集的关联规则更新采掘   总被引:1,自引:0,他引:1  
在交易数据库和最小支持度不变条件下,充分利用在多个交易项目子集中已采掘频繁模式集,对该多个交易项目子集的并集的关联规则的采掘,提出了两咱快速更虎法Kzl-ar和Nzi-ar。  相似文献   

10.
加权关联规则的开采   总被引:24,自引:0,他引:24  
关联规则可以揭示数据之间隐含的关系,并已在许多领域取得了广泛的应用。目前已经提出了许多有效发现关联规则的算法,这些算法都认为每个数据对规则的重要性相同。但在实际应用中,用户更关心近期发生的数据,即历史越久远的数据对规则的影响应该小,应当削弱这些数据对规则的影响,为此,本文提出了垂直加权关联规则的问题;另外,用户有时可能希望加强或削弱某些项目对规则的影响,即所谓的水平加权关联规则。最后,提出了混合加权关联规则的问题,并给出了一个解决该问题的算法MWAL,实验证明了MWAL算法的有效性。  相似文献   

11.
提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法.算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘.②在FP-array中只存放逻辑型数据,节省了存储空间.③直接在FP-array上挖掘而不需要递归创建大量条件模式矩阵,挖掘过程采用逻辑运算,在效率上有独特的优势.通过实验验证了算法的有效性.  相似文献   

12.
数据可视化在数据挖掘中的应用   总被引:2,自引:0,他引:2  
数据挖掘是从大量历史数据中抽取潜在的、有价值的知识或规则的过程。数据可视化对于快速分析数据,表示高维数据方面非常直观、有效。本文首先讨论了几种可视化技术,随后就数据可视化在数据挖掘的模型、过程中的应用进行探讨。  相似文献   

13.
数据挖掘中关联规则的一种高效Apriori算法   总被引:21,自引:0,他引:21  
在数据挖掘中关联规则的频繁项集计算时,通过一种改进的Apriori算法,即用升序替代原来的按字母次序对项集进行排序,可大大精简候选频繁集,而且能保持频繁集的完整性,减少计算开销。  相似文献   

14.
数据挖掘技术在保险业务中的应用   总被引:1,自引:1,他引:0  
随着保险业的快速发展,保险公司积累了大量的业务数据,急需一种有效的技术方法发现这些海量数据中蕴涵的潜在知识,为管理决策提供依据.数据挖掘技术是目前国际上的一个研究热点,可以实现保险业务数据的知识化.分析了我国保险业务的发展现状,介绍了数据挖掘相关技术及其在保险业务中的应用,重点描述了使用判定树技术进行保险客户风险分析的过程.  相似文献   

15.
一种改进的增量数据挖掘算法   总被引:1,自引:0,他引:1  
针对现行增量挖掘算法都不能解决最小支持度和最小置信度发生变化的同时数据库也发生变化的增量更新问题,分析现有算法的不足,提出一种改进算法。该算法充分利用以前挖掘的结果,将链表插入、删除以及hash定位高效率的特性结合起来,摆脱了传统算法多次迭代的不足,可实现最小支持度与最小置信度发生变化的同时,数据库也相应的发生变化的增量更新。并通过实验对该算法进行验证,同时将测试结果与Aprior算法的测试结果进行比较,证明其高效性。  相似文献   

16.
增量式频繁项集挖掘是当前研究的热点,基于FP-Growth的Pre-FUFP算法有效处理了频繁模式的更新,但需递归遍历FP-tree,导致效率较低。提出Pre-FIUT算法,引入频繁超度量树结构,提高了获得频繁项集挖掘效率;基于FIUT的Pre-FIUT可通过查看频繁超度量树叶子结点的支持度确定频繁项集,并与次频繁项集概念相结合进行增量式频繁项集挖掘。实验表明,Pre-FIUT算法能快速扫描和更新数据,合理利用内存,精确获得频繁项集。  相似文献   

17.
在数据挖掘中基于SOM网络的数据分析可视化设计   总被引:2,自引:0,他引:2  
阐述了SOM(Self-Organizing Map)自组织神经网络和Davies-Bouldin聚类判定法,采用SOM网络构建了数据挖掘中数据模型,设计了SOM网络数据分析可视化软件,并进行了详细的可视化数据分析,同时,设计的软件已经初步应用到数据挖掘当中,取得了良好的效果。  相似文献   

18.
分类器是数据挖掘的一种基本方法 .本文首先介绍了分类器的基本概念和准确度评估方法 ,然后讲述了如何用决策树分类器在保险公司建立的保单及索赔信息数据库的基础上寻找保单中风险较大的要素 ,从而得出一些实用的控制投资风险的规则  相似文献   

19.
数据仓库与数据挖掘研究进展   总被引:17,自引:0,他引:17  
随着数据库应用从以事务处理为中心逐渐向以分析处理为中心转化,以数据仓库、联机分析和数据挖掘为中心的基于数据库的分析技术成为近几年来数据库界研究的热点。经过近十年的研究与应用。已经产生了很多的研究成果,建立了较扎实的理论基础,目前正在向与应用领域紧密结合(如流数据)。对现有技术进一步改造方面发展。本文对近两年这几个方向上的研究成果进行了总结。  相似文献   

20.
为了更好地预测后天性脑损伤ABI(Acquired Brain Injury)患者认知功能康复的影响因素,提出基于决策树(DT)、多层感知器(MLP)和广义回归神经网络(GRNN)的三种预测模型。借助于10折交叉验证测试算法,通过专一性、灵敏度和精度分析以及混淆矩阵分析对模型的性能进行测试,从而获得新的知识以评估和改善认知功能康复过程中的有效性。实验结果表明,基于DT的模型的模拟结果明显比其他模型更为优越,预测平均精度可高达90.38%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号