首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
针对流程挖掘过程中忽略低频行为的问题,提出一种基于融合特征网和模块网挖掘低频行为的方法.首先,通过处理有效的事件日志确定通讯行为轮廓关系,并根据日志将特征分为不同模块,重构事件内部行为,挖掘相应的模块网与特征网; 然后,融合特征网与模块网得出完整的流程模型,并通过迭代扩展初始模式得出所有低频模式.实例分析证明,本文提出的方法具有一定的可行性.  相似文献   

2.
交互流程模型的模块分解是查找流程模型变化域的核心内容之一,已有的模块分解方法多是基于完整的流程模型,通过挖掘对比流程模型中所有活动的行为关系将流程模型分解为多个模块网。但是在基于单纯的事件日志分解交互流程模型方面,目前的模块分解方法存在一定的局限性。提出基于Petri网接口变迁的交互流程模型模块网挖掘方法,首先基于系统运行所记录的局部有效事件日志确定其中各活动间的前驱后继关系,并得到相应的活动前驱后继关系表。然后,基于前驱后继关系频繁的活动查找接口变迁,同时考虑无后继变迁的活动。其次,通过分析接口变迁的前集变迁查找交互流程模型中各个模块网的初始变迁,并由初始变迁开始,利用活动前驱后继关系表,逐个添加活动,以此挖掘交互流程模型的模块网。论文最后通过实例验证该优化方法的有效性。  相似文献   

3.
为了满足企业业务流程模型的运行效率、完善网上购物流程,提出了一种基于Petri网行为轮廓的网上购物流程挖掘方法.首先根据某网上购物系统提供的事件日志,利用Petri网行为轮廓的弱序关系,设计出相应的流程模型; 然后通过计算模型与事件日志之间的服从程度,对初始模型进行改进和优化; 最后用实例分析说明了本文挖掘方法的可行性.  相似文献   

4.
针对临床路径事件日志中存在的重名活动和噪音数据,提出集成重名活动判别的过程挖掘算法:统计α算法.给出一套完整的重名活动的判别规则,用于识别过程挖掘中的重名活动并进行相应预处理,有效地提高了过程挖掘的准确性;提出基于经典α算法改进的统计α算法,用于消除事件日志中各种噪音的影响.该算法在临床路径数据量较大的情形下,保证了结果准确率和运算效率.统计α算法在三甲医院的临床数据上得到成功应用,与经典α算法和遗传算法相比,该算法在效率和准确性上更具优越性.  相似文献   

5.
指出现代远程教学存在的弊端,介绍Web挖掘技术的概念、分类及方法,并重点介绍Web日志挖掘的过程和方法,同时提出一个频繁路径遍历算法,最后针对远程教学存在的问题,探讨将Web日志挖掘技术应用于远程教学平台中以实现个性化教学。  相似文献   

6.
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法.构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法...  相似文献   

7.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

8.
互联网上的大型站点每天都会产生大量的Web应用日志,这些日志中通常蕴藏着丰富且宝贵的信息,单节点的数据挖掘系统已无法满足挖掘海量Web日志的要求.针对该问题,研究利用云计算技术在存储和分析数据的优势,采用分布式数据挖掘方法,验证了以分布式模式挖掘日志较单机的集中模式的效率优势,提高了海量日志挖掘过程中存在的时空效率.  相似文献   

9.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

10.
Web日志数据预处理   总被引:1,自引:0,他引:1  
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

11.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性.  相似文献   

12.
提出了使用日志的孤立点分析方法,对日志数据进行预处理,确立合适的挖掘粒度,刻画出正常模式。陇进的方法可对规模较大的数据集进行异常检测,在降低误报率的同时,大大提高检测率,并达到理想的时间效率;使系统定期分析用户日志,从中自动找到可疑的日志,及时预防或者处理非法操作的现象,提高检测系统的智能化、准确性和检测效率。  相似文献   

13.
业务流程预测性监控是过程管理的重要内容,已有的研究大部分是基于显式的工作流模型进行预测.但是在实际应用中,企业可能并没有对整个过程实施端到端的工作流建模和管理,或者由于权限原因只能够获得部分执行日志,难以基于完整的业务流程模型进行预测,对此,提出了一种基于频繁活动集的序列编码处理日志中的低频活动,并通过搜寻历史相似数据进行预测的方法.该方法能够随着日志的更新适应由于概念漂移导致的模型改变.在真实的数据集上进行的实验结果验证了算法的有效性.  相似文献   

14.
针对Android防火墙中的日志系统以及基于日志的入侵检测技术进行了深入研究,提出了误用检测和异常检测相结合的方法对手机防火墙日志进行入侵检测,同时将数据挖掘相关领域的理论和技术应用于入侵检测技术中,通过自主学习和分析各种隐私日志,建立和更新正常特征库和误用特征库,从而实现用户隐私保护,并能对一些木马进行查杀与修复。实验结果证明,该方法对入侵行为具有较高的检测率和较低的误报率,具有较大的实际应用意义。  相似文献   

15.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

16.
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号