首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
针对传统的过程发现算法对大规模事件日志挖掘效率低的问题,提出一种利用Spark集群进行加速过程挖掘的方法。该方法主要针对基于日志活动关系的过程挖掘算法,对抽取活动关系阶段进行加速。通过并行分布式抽取活动关系,将事件日志转化为活动关系矩阵。然后利用关系矩阵,按算法原本的后续步骤,挖掘出过程模型。利用Spark实现分布式α-Mine算法和分布式Flexible Heuristic Miner算法,结果表明:所提方法在时间消耗上优于目前最好的算法,挖掘效率明显提升。  相似文献   

2.
为解决事件日志中含有循环任务、重复任务和同一任务的过程挖掘问题,进一步优化企业建模方法,改进了α算法,提出了τ算法.该算法重新定义了任务之间的关联关系,提出启发式判定规则,识别出事件日志中所包含的循环任务、重复任务和同一任务;然后对事件日志进行挖掘,提取出工作流网,并还原挖掘预处理阶段重命名的重复任务和删除的单循环任务,从而得到最终的工作流模型.最后,通过实例验证了τ算法的正确性.  相似文献   

3.
已有的过程挖掘方法通常以事件日志为输入,挖掘得到扁平过程模型,然而这些方法并不能很好地支持任务之间嵌套关系的识别和分层过程模型的挖掘。由此,提出一种从带有任务生命周期信息的事件日志中识别任务之间嵌套关系,进而挖掘分层业务过程模型的方法,挖掘得到的模型用分层Petri网来描述。在分层过程模型的基础上,给出了模型质量度量方法。为了提高所提方法的通用性和对事件日志中的噪声和低频行为的处理,定义了基本任务关系的频次和频率,并引入噪声阈值来过滤低频关系。所提方法均已在开源过程挖掘平台ProM工具中实现。基于仿真日志数据和真实日志数据,定量比较了所提方法与已有过程挖掘方法挖掘模型的质量,进一步验证了本文方法针对分层业务过程模型挖掘的优势。  相似文献   

4.
流程实例是业务流程的一次具体执行,是标准事件日志的重要组成部分,研究如何管理海量流程实例对于流程数据可视化、流程分析和流程挖掘具有重要意义。针对事件日志采集任务中生成的海量流程实例提出一套存储、索引和检索机制,该机制可以为流程实例从多个维度创建索引,能根据用户输入的组合检索条件快速返回正确的查询结果。通过实验证明了所提管理机制的可行性和有效性。  相似文献   

5.
遗传过程挖掘算法以模型质量引导模型的发现,在挖掘模型的同时不断修正挖掘算法的执行,因此相比于其他挖掘算法,更容易生成高质量的过程模型。但由于其迭代发现的特性,对于大型日志,挖掘效率往往较低且生成模型质量不高。针对以上问题,提出一种基于轨迹聚类种群的遗传过程混成挖掘算法(GMTC)。该算法一方面通过轨迹聚类划分事件日志,简化挖掘环境,再使用归纳挖掘算法对事件日志进行预挖掘,为遗传挖掘算法准备高质初始种群;另一方面优化遗传算子,使用对齐日志得到的模型偏差信息指导突变操作,使得突变操作由随机变为有向,从而有效地提高种群的综合质量,使遗传挖掘算法加快收敛。基于过程日志生成器生成模拟日志、某市政府建筑许可申请过程的真实日志以及6个公开数据集的实验结果表明:基于轨迹聚类种群的遗传过程混成挖掘算法相较于其他挖掘算法不但在挖掘效率方面有较大提升,而且挖掘得到的模型质量也能够达到较高的水平。  相似文献   

6.
针对需要优化的业务流程,提出基于数据库日志之间关联规则挖掘的解决方法。通过对数据库日志向量化使其变为可几何度量的流程日志,并从角度和距离两方面综合分析数据库日志的相似性。采用基于相似性的关联分析算法获得用户行为模式以指导节点的分裂或合并,实现节点结构重塑从而优化流程。该方法还通过多阶迭代的方式评价关联分析的准确性,使算法可以在合理范围内执行。  相似文献   

7.
为了挖掘流程变迁过程中各时段的流程模型,提高流程挖掘结果的准确性,提出了一种基于时变滑窗的自适应流程挖掘方法。在分析了业务流程变化特点的基础上,定义了时变滑窗、相邻事件概率依赖关系等相关概念,研究了以流程实例时间为变量,来控制调整滑窗大小和滑动进度的日志更新规则;基于相邻事件概率依赖关系,给出了流程模型挖掘规则和一种新的流程挖掘算法,根据流程挖掘结果的变化频度和流程实例日志流的到达速率推动时变滑窗持续变更,进而挖掘出整个流程日志中各时段的流程模型。实验结果表明,与已有的流程挖掘方法相比,所提方法具有良好的自适应性和抗噪性。  相似文献   

8.
传统过程挖掘算法是针对静态模型和静态日志进行设计的,不能直接用于演化过程的发现.为此,提出了一种过程挖掘算法,应用滑窗机制实现增量式算法设计,利用日志事件关系模型,引入日志事件关系计数和阈值机制,实现对事件日志流的持续挖掘,因而能够发现模型演化的历史及模型当前实际执行情况.分析了算法性质及相关参数的影响,并进行了实验验证.  相似文献   

9.
日志中发生的低频次行为与挖掘的流程模型中某些不必要的结构相对应,而这些结构的出现会引起挖掘模型在适应度和精确度等指标上的下降。为解决这些结构对流程挖掘模型质量造成的影响,提出一种基于依赖关联度的噪声日志过滤方法。该方法首先根据日志中事件及其依赖关系的统计频率,定义了依赖关系的局部关联度和整体关联度,并将两者归一化为混合关联度来筛选出噪声日志。然后通过轨迹可达性分析去除日志中的噪声,以便最大程度地保留日志轨迹中记录的其他行为。与传统噪声日志过滤算法过滤掉包含噪声日志的整条日志轨迹不同,所提算法在移除噪声日志的同时最大程度地保留了原始日志中的其他非噪声日志。  相似文献   

10.
为了进行流程发现,提出一种基于流程案例簇的任务关系挖掘方法.该方法首先将基本案例按照特征向量分为多个案例簇,根据基本案例的任务轨迹对案例簇中任务间的依赖关系进行挖掘;然后给出了基于循环基元的循环结构建模和挖掘方法,最终可以从事件日志导出流程中完整的任务依赖关系以及存在的循环结构.所提方法能正确处理任务依赖关系随案例属性取值不同而变化的情况.只要日志完备,基于挖掘到的任务关系和循环结构就能得到一个与原流程行为等价的流程模型.  相似文献   

11.
随着大数据时代的来临,为了高性能地转化海量分布式日志,提出事件日志在云平台上基于MapReduce架构的分布式转化算法.提出基于案例拆分的改进算法,以转化单机上的日志,使其变得可行;进一步提出基于MapReduce的并行转化算法.这是在过程挖掘领域中首次实现从海量原始日志到可扩展事件流事件日志的并行转化,极大地提高了转化性能.  相似文献   

12.
针对云计算中不断增长的文件数据存储需求,提出非关系数据库(Not Only SQL)中文件型大数据的存储技术。脱离传统的信息系统和文件系统混合存储文件数据方法,采用MongoDB数据库集群作为存储底层,将数据存储于分布各MongoDB结点中,且存储空间可自由扩展。采用数据分片的方法,实现了文件型大数据的均衡存储,并给出了存储文件数据一般算法。基于NoSQL技术的大数据存储是一种新型应用方式,该系统的负载均衡能力和可扩展度均优于传统技术。  相似文献   

13.
传统业务流程建模与分析任务中通常将活动表示为离散符号,损失了一定的语义信息。针对这一问题,提出了时序活动表示学习方法,使用多维实数向量对活动语义进行量化表示,为深度学习等现代人工智能技术在业务流程建模与分析中的应用提供基础支持。首先利用过程模型对事件日志的高层次抽象能力,通过过程模型挖掘及仿真对原始事件日志进行增强,扩大事件日志规模并强化活动关系统计信息;然后设计了融合活动关系和执行时间信息的向量表示学习算法,从增强后的事件日志中学习活动向量表示。通过在一个公开的真实医院诊疗日志语料上开展的实验研究验证了所提方法相比于传统的词向量学习方法具有明显优势。  相似文献   

14.
针对传统工作流模型挖掘算法不考虑模型中重复任务的存在,导致挖掘出的模型精确度不高的问题,提出一种基于关系矩阵的重复任务识别方法。通过分析工作流执行日志得到所有事件的前驱后继关系,根据不同的模型结构进行事件重命名,再基于同类别重复事件之间的相似度对重复事件进行聚类得到最优识别结果。实验表明,该方法能正确有效地识别工作流日志中的重复任务,减少模型中的不可见任务,最终提高工作流模型挖掘方法的精确度和可理解性。  相似文献   

15.
文章将数据仓库技术应用于Web使用日志文件、用户概貌文件和商业数据库的挖掘,提出了面向电子商务的Web使用挖掘数据仓库系统模型,包括数据抽取、数据转换、数据集成、数据装载和模式发现及分析5个组件,实践证明该模型是有效的。  相似文献   

16.
鉴于理想的完备日志很难被获取,针对特定次序关系完备的日志已成为评估挖掘算法表现的重要数据来源。提出了一种新颖的针对特定次序关系完备日志生成算法,基于完全有限前缀计算轨迹,使日志生成过程可控。扩展了完备日志的生成算法,使日志能够针对Δw关系和w关系完备,从而满足α谱系挖掘算法对日志的完备性要求。同时提出了一种日志生成算法的评估框架,并对日志生成算法进行评估。  相似文献   

17.
制造业中的大规模定制模式对跨域数据与服务协同互联有较高要求,通常需要整合企业内外部各类异构业务系统的海量异质信息。但现阶段部分系统之间的数据共享与交换的基础条件仍不成熟,给跨域信息整合与统一数据空间构建带来困难。提出一种基于日志信息挖掘的跨域数据融合与可视化方法,针对目前大规模定制业务系统中广泛应用的关系型数据,通过分析不同系统的全链路访问日志,建立跨域实体间的动态关联模型,给出了可视化过程中的关联量化参数,并呈现其随时间推移的演化规律,为跨域数据融合、数据空间构建及业务流程优化提供可视化支撑。  相似文献   

18.
针对现有过程挖掘技术在解决成批处理工作流模型挖掘问题上存在的不足,研究了相应的过程挖掘方法。利用系统事件日志中活动实例的输入输出、开始与结束时间等数据,通过引入成批处理特征等概念来发现成批处理区及隐含的事件记录,并结合现有过程挖掘方法来挖掘成批处理工作流模型。该方法充分利用现有过程挖掘方法的优越性能,解决了支持成批处理工作流系统中的模型自动构建问题。通过仿真实验验证了该方法的有效性。  相似文献   

19.
为解决业务流程协同模式中存在的角色能力、权限与职责不匹配的问题,综合考虑角色能力与角色权限,设计了基于角色专业能力评价模型的协同调优算法。首先基于业务流程的数据库操作日志,建立了时间序列模型检测异常业务流程,提出基于元路径的环路挖掘算法(MPLMA),从而挖掘业务流程中由协同导致的重复工作;以数据库的操作和流程日志为基础,建立专业能力评价模型,量化评价角色能力;将专业能力评价模型与权限判定方法相结合,优化角色协同模式。实验结果表明,所提基于元路径的环路挖掘算法能够高效率地挖掘出协同实例,所提出的角色协同调优算法能够精确、合理地指导协同模式的优化。  相似文献   

20.
为了使包含活动数目较多的事件日志有效挖掘流程模型,提出基于行为特征网的流程模型分解挖掘方法,基于活动日志确定各活动间的行为足迹关系,推得相应的行为矩阵;结合行为矩阵计算行为关系图,从而产生活动聚类;通过现存挖掘算法过滤子日志挖掘子网,并对子网添加接口库所形成子网行为特征网;在行为特征网的基础上,运用合成网的观点合成整网,以此挖掘流程模型。最后通过仿真分析验证了该分解挖掘方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号