首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
流程挖掘能够根据流程的执行日志重构出流程模型,有助于实现业务流程的优化和智能管理。首先,指出目前流程挖掘技术需要解决的关键问题。然后,介绍几种具有代表性的流程挖掘算法,并指出每种算法解决的问题和存在的不足。接着,从日志完整性、控制流结构、噪声处理和模型质量控制等方面对流程挖掘算法进行分析和比较。最后,指出流程挖掘技术未来的研究方向。  相似文献   

2.
Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性能较原算法有一定的提高。  相似文献   

3.
过程挖掘是针对流程信息系统所记录下的日志进行分析,将业务流程真实过程还原的技术。目前已有的方法多是基于控制流与数据流的观点,针对任务运行状态的,无时延的业务过程进行挖掘。但在挖掘存在多任务的有时延的业务进程方面,目前的方法存在一定局限性。提出基于队列挖掘优化过程模型的方法,首先利用现有的基于过程挖掘的方法,挖掘业务流程的初始模型。再运用队列挖掘的观点对特定的顾客进行时延预测,挖掘出顾客的行为信息,以此对初始流程模型进行优化。最后通过实例验证了所提出的优化挖掘方法的有效性,优化后的流程模型不仅对事件日志有很好的重放效果,并且能够反应出多类别的,且存在时延的业务流程中任务的行为信息。  相似文献   

4.
一种基于Web日志文件的信息挖掘方法   总被引:20,自引:1,他引:19  
数据预处理和日志挖掘算法是Web日志挖掘中的关键技术。文中根据Web访问模式的用户特征,提出了一种基于Web日志文件的信息挖掘系统的体系结构。在此基础上,分析了其数据挖掘过程和信息挖掘算法。  相似文献   

5.
跨组织业务流程需要多个组织相互配合,协同工作来完成一项由单个组织无法完成的任务.由于跨组织业务流程的复杂性与分布性,其建模与分析过程是一项耗时且容易出错的任务,要求建模人员拥有丰富的经验和行业知识.流程挖掘通过分析业务信息系统执行过程中产生的日志为模型构建提供了一种自动化方法.然而,传统的流程挖掘技术仅支持单个组织的日志挖掘,无法有效地处理跨组织业务流程挖掘问题.本文针对此问题提出一种跨组织业务流程模型挖掘方法.首先扩展已有的流程挖掘方法来进行单个组织的业务流程模型挖掘;其次,定义组织间三种典型的协同模式,并提出相应算法以挖掘组织间的协同模式;再将各个组织的流程模型和协同模式集成,得到全局跨组织业务流程模型;最后采用传统的质量评估指标和提出的协同模式拟合度来量化发现的跨组织业务流程模型质量,通过四个不同的跨组织业务流程案例与已有挖掘方法进行比较,验证本文提出挖掘方法的有效性和可用性.  相似文献   

6.
从Web日志文件中挖掘出用户行为模式,是所有Web站点管理者的迫切需要,但由于web日志数据量大,存有大量的干扰和不完整的数据,导致无法准确的抽取出用户行为的模式。小环境无监督聚类算法适合挖掘具有噪音和不完整数据的大量数据集,但它是基于欧几里德空间的二维模型,数据表示不直观。我们对UNC进行改进,提出了具有层次结构的UNC(简称LUNC)。性能测试实验证明,该模型具有较好的整体性能。  相似文献   

7.
徐杨  袁峰  林琪  汤德佑  李东 《软件学报》2018,29(2):396-416
流程挖掘是流程管理和数据挖掘交叉领域中的一个研究热点.在实际业务环境中,流程执行的数据往往分散记录到不同的事件日志中,需要将这些事件日志融合成为单一事件日志文件,才能应用当前基于单一事件日志的流程挖掘技术.然而,由于流程日志间存在着执行实例的多对多匹配关系、融合所需信息可能缺失等问题,导致事件日志融合问题具有较高挑战性.本文对事件日志融合问题进行了形式化定义,指出该问题是一个搜索优化问题,并提出了一种基于混合人工免疫算法的事件日志融合方法:以启发式方法生成初始种群,人工免疫系统的克隆选择理论基础,通过免疫进化获得“最佳”的融合解,从而支持包含多对多的实例匹配关系的日志融合;考虑两个实例级别的因素:流程执行路径出现的频次和流程实例间的时间匹配关系,分别从“量”匹配和“时间”匹配两个维度来评价进化中的个体;通过设置免疫记忆库、引入模拟退火机制,保证新一代种群的多样性,减少进化早熟几率.实验结果表明,本文的方法能够实现多对多的实例匹配关系的事件日志融合的目标,相比随机方法生成初始种群,启发式方法能加快免疫进化的速度.文中还针对利用分布式技术提高事件日志融合性能,探讨了大规模事件日志的分布式融合中的数据划问题.  相似文献   

8.
流程挖掘是业务流程管理(business process management,BPM)研究的一项重要内容.提出了一种结构化挖掘方法,实现从事务型日志中挖掘出工作流网.该方法基于工作流模型的4种基本结构(顺序、并行、选择和循环)进行挖掘.定义了可挖掘的工作流模型--结构化工作流网(structural workflow net,SWF),从日志预处理,流程挖掘方法和合理性验证3个方面对挖掘算法进行了详细描述,证明挖掘出的工作流模型满足合理性和安全性的同时,具有可读性和容易理解的特点.  相似文献   

9.
一种改进的Web日志挖掘数据预处理方法   总被引:3,自引:0,他引:3  
数据预处理在Web日志挖掘中具有非常关键的作用,只有经过预处理,才能获得准确的数据,才能正确地反映使用者的意图,从而保证分析沿着正确的方向进行。论文在对Web日志挖掘数据预处理的难点进行研究后,提出了用于用户访问页面路径补充的UBPS启发式规则,以便于更好地进行事务识别和后续的用户浏览模式识别。  相似文献   

10.
一种基于Web挖掘的网站性能评价方法   总被引:10,自引:0,他引:10  
文章分析了影响网站性能的各种因素,建立了评价网站性能的指标体系,提出了一种基于Web日志挖掘的评价网站性能的方法,有效地解决了网站性能的评价问题。  相似文献   

11.
在企业业务运行过程中会产生大量的数据,这些数据以事件日志的方式进行保存.通过对事件日志的采集、处理和分析可以支持对业务过程的挖掘、监控和优化.然而,原始的事件日志因含有各种类型的数据质量问题而无法直接应用于过程挖掘与分析.尽管目前在数据挖掘领域已提出各种数据预处理方法进行数据过滤,但由于业务过程事件日志中事件信息的序列化、动态化以及传递性等特点不同于普通数据,所以无法简单地应用传统的数据预处理方法对事件日志进行预处理.本文对事件日志数据预处理的研究现状进行了系统化的总结,分析了事件日志数据预处理技术面临的挑战,并对未来的研究方向进行了展望.  相似文献   

12.
由于流程挖掘技术的快速发展, 流程挖掘算法种类增加迅速, 已有的算法研究文章介绍已不全面. 针对这一情况对迄今为止的流程挖掘主要算法进行系统性的分析总结. 首先对流程挖掘算法现状进行总体分析, 接着根据算法特性将流程挖掘算法分为传统的流程挖掘算法和基于计算智能和机器学习技术的流程挖掘算法两大类, 简要介绍其中代表性算法...  相似文献   

13.
工作流管理系统由工作流模型所驱动,但产业界的实践表明定义工作流模型的工作不仅费时而且易错。工作流挖掘技术能够帮助解决这一问题,并能为现有工作流的分析与优化提供参考。简要介绍三种典型且具有应用价值的工作流模型挖掘算法,并应用其中一种挖掘算法,详细讨论了一个实际的工作流模型挖掘过程。挖掘过程以某Staffware系统的工作流日志文件为起点,包括数据预处理、初始工作流模型挖掘、初始工作流模型化简三个主要步骤,具体实现可通过一个工作流模型挖掘子系统参与完成。  相似文献   

14.
徐彰杰  葛玮 《计算机工程》2010,36(24):33-35
对SOA中业务流程引擎按活动分解业务流程执行语言流程,针对此类活动封装到代理中时产生代理数量过多的情况,提出一个基于流程挖掘的智能流程分发方法,该方法能在3个方面提高系统的性能:改善业务流程在运行时的自适应性;根据检测相关性最强的活动封装到代理中选择最优代理;通过减少代理数量和改善代理信息的方式减少资源的使用。  相似文献   

15.
工作流管理系统要求能够清楚地表达出业务过程的工作流设计,通常工作流设计非常费时且容易出现错误。过程挖掘的方法从已经发生的业务日志记录中提炼出工作流模型,能方便地设计工作流管理系统。本文提出利用FP-tree(频繁增长模式)方法挖掘过程模型,使之能够有效地解决含有噪音数据的过程挖掘问题。  相似文献   

16.
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。  相似文献   

17.
Web日志挖掘的预处理过程及算法   总被引:5,自引:1,他引:5  
随着WWW的广泛应用和Web技术的发展,数据挖掘进入一个崭新阶段。本文详细介绍了Web日志挖掘的预处理过程,通过实例分析了预处理方法,并给出了预处理过程中用户识别的算法实现。  相似文献   

18.
一种并行化的启发式流程挖掘算法   总被引:2,自引:0,他引:2  
启发式流程挖掘算法在日志噪音与不完备日志的处理方面优势显著,但是现有算法对长距离依赖关系以及2-循环特殊结构的处理存在不足,而且算法未进行并行化处理.针对上述问题,基于执行任务集将流程模型划分为多个案例模型,结合改进的启发式算法并行挖掘各个案例模型所对应的C-net模型;再将上述模型集成得到完整流程对应的C-net.同时,将长距离依赖关系扩展为决策点处两个任务子集之间的非局部依赖关系,给出了更为准确的长距离依赖关系度量指标和挖掘算法.上述改进措施使得该算法更为精确、高效.  相似文献   

19.
如何有效地分析用户的需求,帮助用户从因特网的信息海洋中发现他们感兴趣的信息和资源,已经成为一项迫切而重要的课题。解决这些问题的一个途径,就是将传统的数据挖掘技术与Web结合起来,进行Web数据挖掘。其中的Web日志挖掘可以掌握用户在浏览站点时的行为,并且将挖掘出的用户访问模式应用于网站上,在改善Web站点的结构以及页面间的超链接结构,提高站点的服务质量等方面有重要的意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号