首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 70 毫秒
1.
为解决加权遍历模式挖掘问题,概括了加权有向图的种类,提出一种边加权有向图与顶点加权有向图间的变换模型,并基于该模型提出一种基于图遍历的加权序列模式挖掘算法GTWSPMiner.该算法根据遍历模式中的项的连续性特点,采用一种加权前缀投影序列模式增长方法,将原挖掘序列数据库的任务分解成一组挖掘局部投影数据库的小任务.对比实验结果表明,该算法能快速有效地挖掘加权频繁遍历模式.  相似文献   

2.
基于分布式的Web log挖掘模型   总被引:1,自引:0,他引:1  
本文提出了一种基于分布式web log挖掘模型,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担,体现并行计算、异步挖掘、异构数据挖掘的优点。  相似文献   

3.
工作流管理系统由工作流模型所驱动,但产业界的实践表明定义工作流模型的工作不仅费时而且易错。工作流挖掘技术能够帮助解决这一问题,并能为现有工作流的分析与优化提供参考。简要介绍三种典型且具有应用价值的工作流模型挖掘算法,并应用其中一种挖掘算法,详细讨论了一个实际的工作流模型挖掘过程。挖掘过程以某Staffware系统的工作流日志文件为起点,包括数据预处理、初始工作流模型挖掘、初始工作流模型化简三个主要步骤,具体实现可通过一个工作流模型挖掘子系统参与完成。  相似文献   

4.
工作流管理系统由工作流模型所驱动,但产业界的实践表明定义工作流模型的工作不仅费时而且易错.工作流挖掘技术能够帮助解决这一问题,并能为现有工作流的分析与优化提供参考.简要介绍三种典型且具有应用价值的工作流模型挖掘算法,并应用其中一种挖掘算法,详细讨论了一个实际的工作流模型挖掘过程.挖掘过程以某Staffware系统的工作流日志文件为起点,包括数据预处理、初始工作流模型挖掘、初始工作流模型化简三个主要步骤,具体实现可通过一个工作流模型挖掘子系统参与完成.  相似文献   

5.

为解决加权遍历模式挖掘问题,概括了加权有向图的种类,提出一种边加权有向图与顶点加权有向图间的变换模型,并基于该模型提出一种基于图遍历的加权序列模式挖掘算法GTWSPMiner.该算法根据遍历模式中的项的连续性特点,采用一种加权前缀投影序列模式增长方法,将原挖掘序列数据库的任务分解成一组挖掘局部投影数据库的小任务.对比实验结果表明"该算法能快速有效地挖掘加权频繁遍历模式.

  相似文献   

6.
根据加权关联关系挖掘模型和算法,提出一种基于XQuery应用的XML数据加权关联关系的挖掘方法.  相似文献   

7.
基于启发式函数的分布式FN 算法   总被引:1,自引:0,他引:1  
对复杂网络进行社团挖掘和分析是很多领域和学科的重要问题,结合海量数据通联矩阵稀疏的特点,提出了一种基于启发式函数合并的快速社团挖掘算法KFN算法,并建立了算法的MapReduce模型.通过对DBLP论文合著网络数据集进行挖掘可知,分布式模型和基于启发式函数的合并策略能够提高社团挖掘的时间效率.  相似文献   

8.
过程挖掘是PAIS中的一项关键技术,能够根据信息系统中记录的事件日志信息,提取相关知识,重构出一个过程实例模型且日志中所有信息轨迹的实例都能够符合该过程模型.文中通过分析事件日志自动产生过程模型,辅助过程模型的设计与再设计.首先介绍了过程挖掘的概念、基本架构步骤和挖掘算法,然后从过程维度的角度介绍了一种有代表性的过程挖掘算法的应用.最后对α算法过程挖掘领域目前存在的挑战性问题从两个方面进行了分析和讨论.  相似文献   

9.
流程增量挖掘中的模型更新方法   总被引:1,自引:1,他引:0  
正确发现流程实际运作情况对工作流管理有着重要的意义.流程挖掘抽取系统日志信息,挖掘流程的真实运作模型.目前很多该方面的研究,着重于从一份日志中挖掘出工作流模型.然而,这些挖掘方法只关注日志信息,忽略了流程设计者的先验知识.而且,日志所包含信息量较大,进行一次挖掘耗费较大.因此,希望能结合已有工作流模型及新增日志信息,更新工作流模型.已有研究给出对模型及日志的增量挖掘算法.但是,业务流程会随着时间推移变更,可能已有的任务被取消了,因此在新增的一段日志中该任务没被记录.但由于该任务曾经在已有日志中记录下来,故应用已有挖掘算法或增量挖掘算法,在更新模型中,该任务也会被挖掘出来.提出了一种增量挖掘模型更新的改进算法.通过流程设计者的先验知识及统计任务出现的频率,判断该任务是否被取消.最后给出一个实验,验证算法的可行性.  相似文献   

10.
为了简捷表达多维时空拓扑关联模式,针对时空数据库的事件,提出了一种基于事件的星形关联模型,该模型能够表示点线面以外的更多时空信息;针对这种模型提出了一种基于粒度计算的时空拓扑关联模式挖掘算法,该算法只需扫描一次时空数据库,避免了重复计算,有效地提高了挖掘效率。  相似文献   

11.
关联挖掘是一种重要的数据分析方法, 提出了一种在全置信度下的增量队列关联挖掘算法模型, 在传统的FP-Growth及PF-Tree算法的关联挖掘中使用了全置信度规则, 算法的适应性得到提升, 由此提出FP4W-Growth算法并运用到对文本数据的关联计算以及对增量式的数据进行关联性挖掘的研究中, 通过实验验证了此算法及模型的可行性与优化性, 为在庞大的文本数据中发现隐藏着的先前未知的并潜在有用的新信息和新模式, 提供了科学的决策方法.  相似文献   

12.
基于关联规则的Apriori算法的可视化实现方法   总被引:5,自引:0,他引:5  
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了优化.该算法以经典的Apriori算法为基础,改进后的算法在运算速度明显好于Apriori算法.同时,还介绍了一种基于Apriori算法的可视化挖掘模型[1],并讨论了该可视化模型的实现方法.  相似文献   

13.
一种基于Web日志文件的信息挖掘方法   总被引:19,自引:1,他引:19  
数据预处理和日志挖掘算法是Web日志挖掘中的关键技术。文中根据Web访问模式的用户特征,提出了一种基于Web日志文件的信息挖掘系统的体系结构。在此基础上,分析了其数据挖掘过程和信息挖掘算法。  相似文献   

14.
分组多支持度关联规则研究   总被引:3,自引:1,他引:3  
关联规则是数据挖掘的重要任务之一,传统关联规则算法只有一个最小支持度,假设项出现的频率大致相同,而在谮实际中并非如此,由此产生了多支持度关联规则问题.该问题针对每个项给定不同的支持度,而在实际应用中项可以划分成若干个组,每组有一个支持度.由此提出了分组多支持度关联规则问题,针对该问题给出了基于多支持度性质对项进行分组的方法.该方法可以降低2-项候选集的数目.在此基础上,进一步给出了相应的多支持度关联规则发现算法,并通过实验证明了算法的有效性.  相似文献   

15.
基于时序关联规则的商品需求预测   总被引:1,自引:0,他引:1       下载免费PDF全文
为了满足商品销售企业对商品需求预测的需求,提出一种时序关联规则挖掘算法。利用企业商品销售数据与客户相关的特点,提出客户模式数据模型,针对该数据模型,给出时序关联规则挖掘算法。利用该算法对超市销售数据进行时序关联规则挖掘,得到了正确的结果,验证了其在实际应用中的有效性。  相似文献   

16.
针对基于Hopfield神经网络的最大频繁项集挖掘(HNNMFI)算法存在的挖掘结果不准确的问题,提出基于电流阈值自适应忆阻器(TEAM)模型的Hopfield神经网络的改进关联规则挖掘算法。首先,使用TEAM模型设计实现突触,利用阈值忆阻器的忆阻值随方波电压连续变化的能力来设定和更新突触权值,自适应关联规则挖掘算法的输入。其次,改进原算法的能量函数以对齐标准能量函数,并用忆阻值表示权值,放大权值和偏置。最后,设计由最大频繁项集生成关联规则的算法。使用10组大小在30以内的随机事务集进行1000次仿真实验,实验结果表明,与HNNMFI算法相比,所提算法在关联挖掘结果准确率上提高33.9个百分点以上,说明忆阻器能够有效提高Hopfield神经网络在关联规则挖掘中的结果准确率。  相似文献   

17.
关联规则挖掘是数据挖掘中的一个重要任务,传统关联规则挖掘方法计算复杂度高、效率较低,而智能算法在搜索过程中具有保持种群多样性、鲁棒性等优点。本文提出基于免疫克隆文化算法的关联规则挖掘模型,该模型将免疫克隆算法嵌入到文化算法的框架中,利用免疫克隆算法的全局收敛性在数据库中迅速搜索频繁项目集,进而提取用户感兴趣的关联规则;利用文化算法信念空间的知识结构指导种群的进化,增强了搜索的目的性和方向性。实验表明,该模型具有较快的运行速度,提高了所得关联规则的准确率。  相似文献   

18.
传统的关联规则挖掘算法不能在同一事务数据库中连续挖掘多个最小支持度的频繁项目集。为此,提出基于多个最小支持度的频繁项目集挖掘算法。运用集合论定义模型库的概念,将事务数据库转化成模型库,通过检索模型库得到频繁项目集,从而降低频繁项目集的挖掘时间。实验结果表明,该算法的挖掘效率高于Apriori算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号