首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
序列挖掘算法产生冗余序列,造成其运行时间过长.对此,提出了一种新的闭合序列挖掘算法——时序关系下的闭合序列模式挖掘算法.依据闭合序列模式的性质,通过比较频繁序列与每个1-项频繁序列之间的时序关系,推断频繁序列模式是否可扩展.基于IBM公司的合成数据,将其与闭合序列模式挖掘算法进行比较,实验结果表明,这种新的闭合序列挖掘算法可以有效降低运行时间且不易受到属性值个数的影响.  相似文献   

2.
目前为止,研究者仅仅提出了有限的几种挖掘负序列模式的算法,而且对"数据序列是否包含一个负序列"还没有形成统一的定义.本文比较了几种典型算法PNSP,Neg-GSP和NSPM中关于负包含的定义,在同一数据库上进行了实验,并对实验结果进行了比较.  相似文献   

3.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

4.
提出一种进行时间序列模式挖掘的算法,用于对大型数据库的海量数据分析,从中挖掘出超过用户给定支持度和置信度的时间序列,从而为用户的决策支持和趋势预测提供依据,算法分为在数据中对于频繁项集的发现和频繁序列挖掘两个部分,排除不可能达到支持度和置信度阈值的项集,缩小了挖掘中的数据扫描范围,提高了数据挖掘的效率。  相似文献   

5.
时间序列模式挖掘的算法研究   总被引:1,自引:2,他引:1  
提出一种进行时间序列模式挖掘的算法 ,用于对大型数据库的海量数据分析 ,从中挖掘出超过用户给定支持度和置信度的时间序列 ,从而为用户的决策支持和趋势预测提供依据 .算法分为在数据中对于频繁项集的发现和频繁序列挖掘两个部分 ,排除不可能达到支持度和置信度阈值的项集 ,缩小了挖掘中的数据扫描范围 ,提高了数据挖掘的效率  相似文献   

6.
序列模式挖掘算法多是利用了关联规则挖掘中的 Apriori特性 .利用灰关联方法对原始序列 进行净化处理 ,从而减少挖掘算法中的噪声数据 . 其理论依据在于 ,如果一个序列是频繁的 ,那么该序列的时间间隔也必然是频繁的. 利用了灰关联分析方法找出两个项之间的频繁时间间隔 ,再利用该间隔扫描事务序列数据库 ,从而最终找出频繁序列 .  相似文献   

7.
大量的候选项集是挖掘路径遍历模式中的主要问题.针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈.另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小.实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的.  相似文献   

8.
通过论述数据挖掘和序列模式关联规则的概念及作用,对序列模式关联规则的挖掘算法进行研究,以100期彩票开奖结果为挖掘对象,从中找出各个号码的最长序列模式,并对算法进行实现。  相似文献   

9.
序列模式挖掘是数据挖掘中的一个重要研究方向,对序列模式挖掘中的4种算法(AprioriAll、 GSP、 FreeSpan 、Prefixspan)的执行过程及其特点进行了研究,并对这几种算法的时空执行效率进行了定性和定量的分析比较,指出了4种算法各自的适用范围,得出的结果对序列模式挖掘系统的设计具有一定的参考价值。  相似文献   

10.
基于序列模式图可以定义某些结构化的新知识,如分支模式、重复模式以及它们的组合——结构模式.在基于事件的数据或序列数据中发现结构模式是后序列模式挖掘的任务.基于Apriori算法思想,介绍结构模式的主要形式——并发分支模式及其挖掘算法,并通过示例解释挖掘算法的实现过程.该算法的基本思想是在粗并发分支模式的基础上生成并发分支模式,在并发分支模式生成过程中采用自底向上的方法.基于Apriori的并发分支模式挖掘算法的提出为进一步挖掘结构模式提供了重要的理论支持.  相似文献   

11.
参数率定是进行水位流量关系曲线拟合的关键,采用水位流量关系拟合的改进模型,运用遗传算法率定模型中的参数,并与目标规划法进行了比较,表明遗传算法具有简便、快速、实用性强等优点,是一种较为优秀的全局优化方法,适应于非线性的参数率定.  相似文献   

12.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性。最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的。  相似文献   

13.
数据挖掘具有广泛的应用,频繁模式发现是关联规则挖掘问题的重要组成部分。频繁模式的增量挖掘是一个挑战性的任务,已有的几种基于Apriori思想的方法,具有代价太高的弱点。本文提出了一个基于模式分解树,不需要扫描原数据库的增量挖掘算法。通过合理地组织候选项索引,可以取得较高的效率。  相似文献   

14.
为了从海量的信息资源库中进行析取、识别和发现潜在正确和有用、前所未知的、最终可理解的知识,从数据挖掘技术的研究入手,对关联规则挖掘算法Apriori算法的关键思想以及性能进行了研究,在此基础上分析和探讨了Apriori Mend算法,并给出了该算法的实现思想和步骤,同时通过实例说明了算法的执行过程,该算法提高了原算法的效率。  相似文献   

15.
基于栅格的量化关联规则挖掘算法在发现模式上是高效的,但是这些算法本质上面向低维数据,局限了其应用领域。推广基于栅格的概念,提出一个基于广义链表的,元规则制导的,直接从关系表中挖掘多维量化关联规则的算法。结果表明,此算法对数据规模的时间复杂度是线性的,对元规则维度的时间复杂度是对数线性的。  相似文献   

16.
改进的PrefixSpan算法及其在序列模式挖掘中的应用   总被引:2,自引:0,他引:2  
由于序列模式挖掘需要花费大量计算时间,并需要占用大量存储空间.减少计算量、节省存储空间开销成为序列模式挖掘的关键.因PrefixSpan 算法不产生候选,而适当应用Bitmap数据结构可避免重复扫描数据库,基于此,本文提出了BM-PrefixSpan算法,用于序列模式挖掘,设计并构造了PFPBM(Prefix of First Position on BitMap)表用于记录序列中的每个项在位图中第1次出现的位置.实验结果表明,BM-PrefixSpan算法综合了PrefixSpan和SPAM算法的优点,能够更快、更好地挖掘出序列模式.  相似文献   

17.
将区域物流能力划分为4个方面:物流承载能力、物流规划能力、物流运作能力和物流创新能力。在此基础上,构建区域物流能力与商品流通格局关系的概念模型和理论假设模型。以武汉市商品流通业和物流业为实证研究对象,运用调查问卷和结构方程模型进行分析,对所提出的假设进行验证。研究结果表明:4种物流能力对商品流通格局具有显著正向影响,对商品流通格局的影响作用由大到小依次为:物流规划能力、物流承载能力、物流运作能力和物流创新能力。  相似文献   

18.
把数据挖掘应用到SNP和单体型分析,采用数据挖掘的方法得到SNP位点序列和单体型序列,从结构关系模式挖掘的角度,分析SNP位点之间、单体型之间可能存在的结构关系.并为用结构关系模式挖掘分析SNP和单体型之间的结构关系奠定基础.  相似文献   

19.
针对设计模式挖掘结果有效性评估方法缺乏的问题,提出一种设计模式挖掘有效性评估策略,分结构型、行为型和创建型三类归纳了设计模式的设计意图,分析了设计模式挖掘的基准测试系统,探究了设计模式挖掘结果的中间形式表示,为设计模式挖掘的理论与应用研究提供了重要支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号