排序方式: 共有7条查询结果,搜索用时 15 毫秒
1
1.
过程挖掘的目标是从软件系统产生的日志数据中提取出有价值信息,用于配置或优化已实施的业务过程.与此同时,大数据、物联网等技术的发展不仅使得业务内容愈加复杂,更是加速了业务演化的速度.在此背景下,有必要对原始日志进行划分,使得事件日志通过分解而被更有效地分析,进而提升过程挖掘的质量.日志划分的宗旨是根据不同问题采取不同方法将原始事件日志划分为多个子日志,为后续的过程挖掘研究提供支撑.模型发现是过程挖掘中最重要的应用场景,而该场景面临的两大难题就是模型过于复杂和模型不正确.当前,解决这两个难题的方法分别是轨迹聚类和概念漂移,而这两类方法的本质都是对原始事件日志进行了划分.本文针对轨迹聚类和概念漂移两个分支进行归纳总结,试图厘清日志划分内容中这两个分支的异同点.接着,通过文献规约系统地对现有研究进行统计与分析,揭露了两个研究分支的发展趋势.然后,梳理了现有研究方法的主要思路,将轨迹聚类分为距离驱动、模型驱动和混合聚类三类,并将概念漂移分为单一类型和复合类型两类.最后,利用公开数据集测试不同类型算法的优缺点,并指出未来研究的发展方向. 相似文献
2.
3.
信息领域中常常会涉及到子系统的划分问题,而U/C矩阵法是信息系统划分的一种常用方法,但是系统的复杂性以及人为的参与常常导致子系统划分产生低效率、不确定性以及错误划分等问题。因此深入剖析了系统与子系统、子系统与功能、功能与数据等之间的关系与性质,通过对U/C矩阵按照功能相似度进行层次聚类,并引入结构熵和Hpal熵来对聚类形成的子系统进行度量,给出了具体的计算公式,提出了一种新的划分子系统的方法,将原本需要人为参与的事情转变为通过计算来完成。同时,实现了一个原型系统来对所提出的方法进行验证,并给出了具体实例。 相似文献
4.
过程挖掘中漂移检测的目的是通过检测日志的变化来断定模型是否发生了改变,然而现有方法存在抽取特征量大、检测延迟及无法准确定位变化区域的局限。针对突发漂移检测提出一种基于完备性的漂移检测算法。首先,将突发漂移检测转换为日志中局部完备性计算问题;然后,利用切比雪夫不等式推断完备性表达式;进一步,通过可选参数的窗口来训练完备性初始值,避免选择及并发结构的干扰;最后,定义了切割操作对漂移之前的完备值进行清除,进而对日志进行迭代检测。通过多组模型数据进行了实验评估,并与已有方法进行对比,验证了所提方法的有效性。 相似文献
5.
为解决现有挖掘算法无法从不具有显式行为特征"aba"的局部完备性的日志文件中挖掘最简2度循环的问题,对经典的alpha算法进行了扩展,提出了αL算法,用于从具有行为特征或不具有行为特征的局部完备性日志中挖掘出最简2度循环。给出了最简2度循环的形式化定义。从全局角度根据不同结构具有不同行为轨迹来区分最简2度循环与并发结构。通过紧邻关系的强弱,来有效识别并发分支上同类型的最简2度循环结构。通过大量模型实验表明了所提算法的有效性,并将算法集成在开源框架ProM中。 相似文献
6.
为提升模型发现的质量,可以利用日志划分将原始日志数据划分为多个子日志。现有日志划分的评价方法基本采用有标的方式来衡量划分的质量,而实际生活中很难获取到有标的日志数据。为此,提出划分熵作为无标日志划分的衡量标准。首先,定义轨迹变体用于刻画每个子日志的分布情况。其次,提出内部熵和外部熵来分别刻画子日志的内聚度和差异性。然后,利用惩罚因子对盲目迎合评价指标的划分方法进行惩罚。最后,将以上内容进行融合,形成划分熵的表达式。实验结果表明了所提方法的可行性。 相似文献
7.
现有过程挖掘算法依赖于“aba”模式来挖掘2度循环,而满足局部完备性的日志文件中不一定出现该模式.为此,本文扩展经典alpha算法,提出了αL+算法,用于从没有“aba”模式的日志文件中挖掘出2度循环.首先,建立任务间的次序向量矩阵,用于抽象2度循环结构的变体结构.然后,从全局视角,根据事件的出现次数及位置,来区分2度循环和并发关系.最后,提出紧邻度和回路抽象,以排除并发分支上同类型循环带来的干扰.实验表明,与现有挖掘算法相比,αL+算法能从具有“aba”模式或不具有“aba”模式的日志文件中挖出2度循环.此外,该算法实现且集成在开源框架ProM中. 相似文献
1