首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
在多数据库挖掘的过程中一般要先将多个数据库按照某种规则进行划分,再进一步进行模式挖掘,提出了一种基于关联规则的相似度测量方法,将各个局部模式库进行划分,并对划分的结果进行评价,接着根据评价的结果设计出了一个选择最好划分的算法,找出最好的一种划分。最后经实验验证,算法是准确而有效的。  相似文献   

2.
林颖 《计算机工程》2011,37(22):64-66
针对数据库减量时不断重复挖掘的问题,在已有闭合序列模式算法PosD*的基础上,提出一种减量挖掘算法 DePosD*。通过移动频繁和非频繁闭合序列集合之间的数据,在原有挖掘结果上直接进行更新,减少挖掘的时间。实验结果证明,在减量过程中该算法的时间效率与PosD*相比有所提高。  相似文献   

3.
移动对象聚集模式是指由移动对象参与的一组群体事件,通常用来预测交通系统中出现的异常现象.然而由于海量移动轨迹数据的产生,已有的研究方法难以准确、高效地挖掘特定的聚集模式.为此,提出一种基于时空图的移动对象聚集模式挖掘方法.该方法首先通过改进的空间聚类算法(DBScan)分析轨迹数据,从而获得移动对象聚类;然后,利用时空图模型代替单独存储轨迹数据的方式,用于实时观测移动对象聚类的时空变化特征.最后提出基于最大完全子图查找的聚集检索算法及其改进算法,用于查找满足时空约束的最大完全子图.基于真实大规模轨迹数据集上的实验结果表明,所提出的方法在移动对象聚集模式挖掘的准确性和高效性方面优于其他方法.  相似文献   

4.
通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关键技术进行分类,包括基于Apriori、基于树、基于列表、基于映射、基于垂直/水平数据格式、基于索引等方法。针对现有关键技术的用途和优缺点进行了全面概述,由于静态数据难以满足实际需要,总结了在数据流上应用的HUPM方法,主要包括基于增量方法、基于滑动窗口模型方法、基于时间衰减模型方法、基于地标模型方法等。最后,给出了现有技术的不足和改进方向,并且有针对性地提出了新的研究方法。  相似文献   

5.
目前,不少审计系统引入数据挖掘技术以增强系统功能。其中,大多数都是基于关联规则技术。关联规则技术无法挖掘出具有时序特征的规则,而序列模式挖掘刚好能解决这方面的问题。该文讲述一种基于序列模式挖掘技术的审计系统的设计与实现。该审计系统审计的数据源自身份验证、入侵检测、访问控制等模块产生的事件记录,并通过序列模式挖掘技术来分析这些记录,从中提取规则实现审计,并介绍了如何解决选取数据、预处理数据、选取挖掘算法等实际问题的方法。  相似文献   

6.
在大数据环境下Apriori频繁模式挖掘算法在数据处理过程具有预先设定最小阈值、时间复杂度高等缺陷, 为此采用多阶段挖掘策略实现并行化频繁模式挖掘算法PTFP-Apriori。首先将预处理数据以模式树的形式存储,通过最为频繁的[k]个模式得到最优阈值。然后根据该值删除预期不能成长为频繁的模式以降低计算规模,并利用弹性分布式数据集RDD完成统计项集支持度计数、候选项集生成的工作。实验分析表明相比于传统的频繁模式挖掘算法,该算法具有更高的效率以及可扩展性。  相似文献   

7.
陈传毅  戴卫军 《计算机仿真》2021,38(1):287-290,349
针对当前高维数据隐藏模式挖掘精度较低、执行时间较长,且挖掘过程工作量较大,过程较为复杂的问题,提出了基于贝叶斯网的高维数据隐藏模式挖掘方法.通过有向无环图像与概率表构成贝叶斯网络,分析数据挖掘框架,采用贝叶斯网络对高维数据缩小开销计算,利用信号处理方法提取数据信息特征,对高维数据信息子空间降维,采用自适应级联滤波完成数...  相似文献   

8.
针对数据流间“模式依赖”问题,给出了一种模式依赖挖掘算法,该算法包括:挖掘前时间序列分段和模式表示,条件规则元组的创建和维护,模式依赖的置信度和支持度计算,2个或N个数据流概要结构的设计等。股票数据实验和实际系统表明,该挖掘方法能够有效地发现数据流间的模式依赖,可用于预测。  相似文献   

9.
韩萌  丁剑 《计算机应用》2019,39(3):719-727
一些先进应用如欺诈检测和趋势学习等带来了数据流频繁模式挖掘的发展。不同于静态数据,数据流挖掘面临着时空约束和项集组合爆炸等问题。对已有数据流频繁模式挖掘算法进行综述并对经典和最新算法进行分析。按照模式集合的完整程度进行分类,数据流中频繁模式分为全集模式和压缩模式。压缩模式主要包括闭合模式、最大模式、top-k模式以及三者的组合模式。不同之处是闭合模式是无损压缩的,而其他模式是有损压缩的。为了得到有趣的频繁模式,可以挖掘基于用户约束的模式。为了处理数据流中的新近事务,将算法分为基于窗口模型和基于衰减模型的方法。数据流中模式挖掘常见的还包含序列模式和高效用模式,对经典和最新算法进行介绍。最后给出了数据流模式挖掘的下一步工作。  相似文献   

10.
预测是一种非常有效的数据分析方法.随着决策支持的快速发展,建立起一个通用预测模型库供各行各业的决策支持应用使用变得十分必要.本文提出了通用预测模型库的主要特征,介绍了一个采用COM组件技术实现的通用预测模型库及其在基于数据仓库的经营计划编制过程中的应用.此外,本文还讨论了一个利用COM多态实现的预测模型选择算法.  相似文献   

11.
由于激光质谱系统逻辑结构复杂多样,激光输出功率是激光质谱系统进行的关键条件之一,提前掌握激光输出功率未来状态的发展趋势可为激光质谱系统运行决策提供重要依据,因此进行激光质谱系统激光输出功率的预测技术研究非常必要。采用M5预测模型、线性回归模型、向量机模型对质谱系统的激光输出功率历史数据进行了建模及预测分析,通过比较几个预测模型的预测误差及平均误差,结果表明M5预测模型的预测结果相对最优。通过对激光输出功率历史数据的分析及预测,确定了激光质谱系统激光输出功率的研究预测模型。  相似文献   

12.
瞿超  刘鸿雁 《微计算机信息》2007,23(33):148-149,162
频繁模式挖掘是数据挖掘中的一个重要部分,现有的模型具有各自的优点,但在智能性方面表现较差。对于已经存在的Agent系统,多数都是以语言的形式进行描述,本文对Agent进行形式上的描述,并应用到数据挖掘的模型中,使其智能性得到提高,并有很高的可移植性。  相似文献   

13.
现有的序列模式算法大都需要频繁访问数据库,效率低.本文提出了一种只需访问数据库一次的基于概念的序列模式算法SPC(Sequential Pattern Algorithm Based on Concept).它利用概念来保存信息,通过划分搜索空间得到概念,并在保证数据挖掘结果正确的前提下采用项有序,合并等价子空间和舍弃无效子空间等手段减少搜索空间数量,提高了效率.  相似文献   

14.
提出了一种基于H-tree的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,根据包含此模式的所有元组中的多维信息构造H-tree树,挖掘出相应的多维模式,从而得到了多维序列模式。该算法将多维分析方法与序列模式挖掘算法有效地结合在一起,当维度较高时具有较高的性能。  相似文献   

15.
罗达  李志方  崔昊 《计算机工程》2008,34(16):72-74
工作流模式挖掘是数据挖掘新的研究领域,可以从工作流执行所产生的记录中还原工作流模式,能有效地应用于业务需求建模和业务流程重构等方面。该文提出一种基于偏序代数运算和三角优化规则的工作流模式挖掘算法,只需要对业务执行记录进行一次性扫描,就能在线性时间内识别并还原出工作流模式。研究实验表明,该算法能获得较优的工作流模式,完整性较高,能包含原工作流,受执行记录覆盖率影响不大。而执行记录覆盖率越高,该算法所得工作流模式与原工作流模式的一致性也越大,因此,算法具有较高的应用价值。  相似文献   

16.
基于Clementine的图书馆流通数据挖掘   总被引:1,自引:0,他引:1  
数字图书馆改变了传统图书馆的服务模式,同时也积累了大量的读者信息,为个性化服务提供了数据基础。本文重点研究聚类分析技术及其在图书馆中的应用,利用Clementine的两步聚类模型实现对读者的聚类分析,将读者聚类为消极型、一般型和积极型三种类型,针对不同类型的读者,图书馆可以提供相应的个性化服务。  相似文献   

17.
提出一种新的闭合序列模式挖掘算法,该算法利用位置数据保存数据项的序列信息,并提出两种修剪方法:逆向超模式和相同位置数据。为了确保格存储的正确性和简洁性,另外还针对一些特殊情况做处理。试验结果表明,在中大型数据库和小支持度的情况下,该算法比CloSpan算法[8]更有效。  相似文献   

18.
针对关系型数据流,提出一种基于流立方体框架的频繁模式挖掘算法。通过数据流的不断到达动态地创建流立方体来保存近期数据流信息,当用户提出查询请求时在以创建的流立方体基础上进行频繁模式的挖掘计算,返回相应的查询结果,可以快速地挖掘数据流各维之间存在的所有频繁模式。通过分析和实验表明该算法有较好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号