首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 89 毫秒
1.
事件日志记录数量众多的事件,不仅包含与活动控制流相关的内容,还记录有关活动执行者的信息,即组织维度信息.控制流发现算法从事件日志中自动构建控制流过程模型,组织维度发现算法则构建社交网络模型.如果能合并两种维度,在同一个模型中进行展示,则能够提供更完整的过程组织视图,有助于更准确地对过程以及组织进行分析.因此,提出一种基于执行者过程树的双维度遗传过程挖掘方法(BdSm).一方面,使用Induc-tive Miner预挖掘以优化遗传挖掘算法初始种群,达到生成高质量的控制流模型的目的;另一方面提出日志中活动之间距离的度量方法,能有效度量活动在组织层面的相似度,同时使用执行者信息扩充控制流过程模型,基于执行者过程树生成双维度的过程模型.通过模拟日志以及4个公开事件日志集对所提方法进行验证,结果表明,在控制流维度,所提方法能够生成较高综合质量的过程模型,同时借助组织维度信息,还能够发现典型的工作模式及组织结构.  相似文献   

2.
传统过程挖掘算法是针对静态模型和静态日志进行设计的,不能直接用于演化过程的发现.为此,提出了一种过程挖掘算法,应用滑窗机制实现增量式算法设计,利用日志事件关系模型,引入日志事件关系计数和阈值机制,实现对事件日志流的持续挖掘,因而能够发现模型演化的历史及模型当前实际执行情况.分析了算法性质及相关参数的影响,并进行了实验验证.  相似文献   

3.
针对传统的过程发现算法对大规模事件日志挖掘效率低的问题,提出一种利用Spark集群进行加速过程挖掘的方法。该方法主要针对基于日志活动关系的过程挖掘算法,对抽取活动关系阶段进行加速。通过并行分布式抽取活动关系,将事件日志转化为活动关系矩阵。然后利用关系矩阵,按算法原本的后续步骤,挖掘出过程模型。利用Spark实现分布式α-Mine算法和分布式Flexible Heuristic Miner算法,结果表明:所提方法在时间消耗上优于目前最好的算法,挖掘效率明显提升。  相似文献   

4.
为解决传统过程挖掘算法在处理蕴含复杂结构的海量日志时的低效低质问题,提出一种支持复杂结构的混成过程挖掘方法。该方法首先将事件日志转化为具有发生次数的直接后继图,以支持活动间基本关系的判定;通过过程树对已发现的两两活动间的基本关系进行抽象与合并,进而对日志进行更新,反复迭代直到整个日志中的所有具有基本关系的活动被全部发现。若待发现模型由基本块组成,则挖掘结果为基于块的过程模型;若待发现模型包含复杂结构,则通过混成使用基于区域的方法对复杂结构进行发现。最终利用活动重构操作对挖掘结果中已抽象为过程树的部分进行细化,从而获得最终结果。为了进一步提升挖掘效率,还提出并行化的发现与重构方法。大量基于真实数据的实验结果表明,该方法的挖掘效率和挖掘精确度达到了较好的水平。  相似文献   

5.
日志中发生的低频次行为与挖掘的流程模型中某些不必要的结构相对应,而这些结构的出现会引起挖掘模型在适应度和精确度等指标上的下降。为解决这些结构对流程挖掘模型质量造成的影响,提出一种基于依赖关联度的噪声日志过滤方法。该方法首先根据日志中事件及其依赖关系的统计频率,定义了依赖关系的局部关联度和整体关联度,并将两者归一化为混合关联度来筛选出噪声日志。然后通过轨迹可达性分析去除日志中的噪声,以便最大程度地保留日志轨迹中记录的其他行为。与传统噪声日志过滤算法过滤掉包含噪声日志的整条日志轨迹不同,所提算法在移除噪声日志的同时最大程度地保留了原始日志中的其他非噪声日志。  相似文献   

6.
鉴于理想的完备日志很难被获取,针对特定次序关系完备的日志已成为评估挖掘算法表现的重要数据来源。提出了一种新颖的针对特定次序关系完备日志生成算法,基于完全有限前缀计算轨迹,使日志生成过程可控。扩展了完备日志的生成算法,使日志能够针对Δw关系和w关系完备,从而满足α谱系挖掘算法对日志的完备性要求。同时提出了一种日志生成算法的评估框架,并对日志生成算法进行评估。  相似文献   

7.
为了提高过程挖掘中计算最优对齐的效率,提出一种基于Petri网的事件日志与过程模型之间的快速对齐方法——RapidAlign方法。该方法在观察日志的同时运行模型,比对日志活动与模型活动,从而得到日志移动、模型移动和同步移动;根据移动类型计算代价值,并记录日志和模型的当前状态;选取代价值最小的状态继续日志的观察和模型的运行,直到日志和模型均到达结束状态。最终生成一个最优对齐图,其源节点到终节点之间的路径包含了基于标准似然代价函数的事件日志与业务过程模型之间的所有最优对齐。对RapidAlign方法的适用性进行了详细且严格的描述,从理论上证明了该方法的正确性与有效性。通过仿真实验,验证了RapidAlign方法的优越性。  相似文献   

8.
已有的过程挖掘方法通常以事件日志为输入,挖掘得到扁平过程模型,然而这些方法并不能很好地支持任务之间嵌套关系的识别和分层过程模型的挖掘。由此,提出一种从带有任务生命周期信息的事件日志中识别任务之间嵌套关系,进而挖掘分层业务过程模型的方法,挖掘得到的模型用分层Petri网来描述。在分层过程模型的基础上,给出了模型质量度量方法。为了提高所提方法的通用性和对事件日志中的噪声和低频行为的处理,定义了基本任务关系的频次和频率,并引入噪声阈值来过滤低频关系。所提方法均已在开源过程挖掘平台ProM工具中实现。基于仿真日志数据和真实日志数据,定量比较了所提方法与已有过程挖掘方法挖掘模型的质量,进一步验证了本文方法针对分层业务过程模型挖掘的优势。  相似文献   

9.
过程发现的目的是基于记录在事件日志中的业务过程的执行数据发现过程模型,由于一些原因导致过程模型中可能会出现隐变迁,而这些隐变迁的执行又不出现在事件日志中,因此隐变迁的挖掘是过程挖掘的难点之一.已有隐变迁挖掘方法对解决并发结构中的隐变迁存在不足,且可能出现一些冗余的隐变迁.基于此,提出一种带隐变迁的过程模型挖掘新方法,首先基于日志分析活动的基本行为关系,通过并发交叉关系和循环交叉关系来发现and网关类型和循环类型的隐变迁.然后,根据活动基于日志的最小和最大行为距离寻找可能存在skip类型隐变迁的活动对,进一步分析该活动对基于模型和并发结构的最小行为距离,以发现skip类型的隐变迁,并不断优化初始模型,最终得到带多种类型隐变迁的过程模型.实验结果表明,该方法能正确地发现多类型隐变迁,相对现有隐变迁挖掘方法,所提方法能显著降低模型中冗余隐变迁的个数,同时在不降低模型精确度的前提下,有效地改善了模型的适合度.  相似文献   

10.
海量、异构的Web日志同时蕴含有巨大潜在价值的信息,为有效发现这些资源,并用于为用户提供更高效的服务,建立了智能电子商务模型,指出通过Web使用挖掘,发掘规律、模式和知识来支撑电子商务的智能。提出了细化最大向前引用模型算法,用于处理Web日志,获取用户事务序列,并与最大向前引用模型算法进行了比较,说明细化后的算法更能反映用户浏览习惯。将这些用户事务序列转换为二进制向量,并结合改进蚁群聚类算法,对它们进行了聚类操作,实现了用户簇聚。最后,建立了在线自动聚类的智能电子商务系统原型,并应用到了实际运营的Web系统中,验证了原型的合理性。  相似文献   

11.
关系数据库作为企业管理数据的主要工具,在信息系统运行过程中记录下大量事件日志。传统的流程挖掘技术主要处理用文件存储的XES格式日志数据,每次挖掘任务都需要手工从数据库导出最新日志文件,整个过程操作十分繁琐,且无法充分利用关系数据库强大的数据处理能力。针对该问题,研究了面向关系型日志数据的流程挖掘策略与算法。针对关系数据库中储存的大规模事件日志,利用关系数据库的快速排序能力,提出一种挖掘流程任务之间紧邻关系的近似线性挖掘算法,提高了关系型事件日志的流程挖掘效率。该算法对业务数据库侵入性小,具有较好的通用性。该算法已在开源软件平台ProM上实现,通过基于大规模事件日志的对比实验验证了该方法的高效性。  相似文献   

12.
为解决事件日志中含有循环任务、重复任务和同一任务的过程挖掘问题,进一步优化企业建模方法,改进了α算法,提出了τ算法.该算法重新定义了任务之间的关联关系,提出启发式判定规则,识别出事件日志中所包含的循环任务、重复任务和同一任务;然后对事件日志进行挖掘,提取出工作流网,并还原挖掘预处理阶段重命名的重复任务和删除的单循环任务,从而得到最终的工作流模型.最后,通过实例验证了τ算法的正确性.  相似文献   

13.
提出基于聚类及链接分析的挖掘模型LinkNetClus,该模型将对象类型分为目标类型及属性类型,并假设目标对象属于每个簇的概率依赖于与之相关的其他对象,在目标对象上进行迭代的聚类操作,最终得到具有多样性的聚类结果。该模型充分利用了异质信息网络中的关联关系,得到多维的挖掘结果来解决数据冗余的问题,结果的可解释性也优于排序序列。通过实验证明了使用LinkNetClus得到的聚类结果比已有的基准方法提高大概30%~50%左右。  相似文献   

14.
为了发现过程模型漂移的时间点,提出一种基于活动关系频繁度的日志分割方法。事件日志可以用活动关系抽象表示。通过关系抽取将事件日志转化为活动关系矩阵,然后分析每个活动关系的变化趋势并检测出候选变更点将所有候选变更点通过密度聚类的方式进行合并,得到模型漂移的时间点。在人工生成日志上的实验结果表明,算法具有良好的准确率、较小的误差和较低的时间消耗。  相似文献   

15.
基于变异粒子群算法的过程挖掘   总被引:1,自引:0,他引:1  
为实现过程挖掘,克服标准粒子群算法易陷入局部极值的缺点,提出基于变异操作的粒子群过程挖掘方法。在标准粒子群算法进化中,所有粒子追随最优粒子在解空间搜索,导致种群多样性迅速下降,出现早熟收敛。受遗传算法启发,通过对进化中的粒子增加变异操作,使算法摆脱易于陷入局部极值点的束缚,增强算法跳出局部最优的能力。仿真结果表明,基于变异粒子群算法的过程挖掘在求解的精度和速度方面都得到了好的效果。  相似文献   

16.
针对现有的符合性检测方法大都基于单个活动的对齐,且只给出模型与日志的快速匹配方法,存在非块结构模型不敏感的问题,提出一种基于直接后继关系对齐的过程符合性检测方法。首先,根据直接后继关系得到模型与日志相关属性,并以紧邻活动对的方式展现出来。其次,根据基于紧邻活动对的最优对齐算法(AAP),得到轨迹的最优匹配活动对序列,提出基于最小代价的单条迹与模型的拟合度函数,并给出拟合度算法(DFA),计算日志与模型的拟合度。最后使用实际案例对所提方法进行了评估,结果表明:该方法能够正确计算过程模型与日志之间的拟合度,且具有较好的时空复杂度。  相似文献   

17.
对医疗数据进行挖掘分析生成疾病治疗的标准过程模型,或者为治疗方案制定提供决策支持,是当前研究热点之一。基于历史患者的用药数据对疾病的药物治疗过程模型进行挖掘,并提出一种过程模型与用户体征数据相融合的药物推荐方法。具体而言,对于给定的疾病种类,首先利用隐含狄利克雷分布LDA主题模型对患者用药数据进行训练,得到药物治疗的功效主题以及各个诊疗日的药物功效主题分布;然后,对患者各个诊疗日的功效主题分布进行聚类,将患者的药物治疗过程转换为药物功效组合标签序列,在此基础上构建药物治疗过程的概率后缀树模型;最后,基于概率后缀树计算各节点后续治疗所采用药物功效组合的概率分布,将其与病人的体征向量作为联合特征,病人真实用药对应的功效组合作为分类标签,使用XGBoost的分类方法训练模型,并利用该模型进行患者药物推荐。以MIMIC-Ⅲ数据库中糖尿病患者的处方日志和体征数据为例,对所提方案的可行性和有效性进行了评估。  相似文献   

18.
随着大数据时代的来临,为了高性能地转化海量分布式日志,提出事件日志在云平台上基于MapReduce架构的分布式转化算法.提出基于案例拆分的改进算法,以转化单机上的日志,使其变得可行;进一步提出基于MapReduce的并行转化算法.这是在过程挖掘领域中首次实现从海量原始日志到可扩展事件流事件日志的并行转化,极大地提高了转化性能.  相似文献   

19.
针对演示学习中高斯混合模型参数估计效率低,泛化能力不足的问题,提出一种基于狄利克雷过程聚类和高斯混合模型的复合动态运动基元算法。为实现高斯混合模型参数的实时估计,使用基于距离阈值的狄利克雷聚类算法进行演示轨迹点在线聚类,并引入Welford公式更新参数以提高参数估计效率。获得轨迹分布特征后,使用动态运动基元进行高斯混合回归轨迹的编码,以提高轨迹泛化能力。为了验证算法的有效性,引入了轨迹可达性和相似性指标评价算法的学习泛化能力,设计了基于手写体字母轨迹和机器人动觉示教的演示学习实验。实验结果表明,所提复合动态运动基元算法参数估计平均时间仅0.052 ms,具备快速轨迹复现和泛化能力。  相似文献   

20.
为了解决多任务复杂制造过程中的工作流变异导致的流程和资源的不确定性,进而导致制造资源模型出现实时变化,提出了基于过程挖掘与复杂网络集成的制造过程资源模型,得到了流程与资源信息集成的资源复杂网络模型与分析方法。首先,从制造过程中实时产生的事件日志出发,提出了一种基于统计α算法的过程挖掘算法,解决了制造过程工作流重构问题,可实时发掘实际制造过程中的工作流模型。接着,通过集成过程挖掘算法和复杂网络理论,构建了集流程信息与资源信息于一体的资源网络模型,提出了资源节点与流程节点的关联性分析方法,识别制造过程中的关键加工节点。最后,结合一个复杂的锥齿轮轴-轴承套组件装配过程实例,全面验证了所提出方法在制造过程工作流重构、资源网络模型建模、资源特性分析与关键加工节点的识别上的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号