共查询到20条相似文献,搜索用时 15 毫秒
1.
多维序列模式挖掘是在序列模式挖掘的基础上发展起来的,文章阐述了有关概念,介绍了两种序列模式挖掘算法:GSP算法和PrefixSpan算法,在对两类算法进行比较分析的基础上形成了挖掘多维序列模式的UniSeq算法、Dim-Seq算法和Seq-Dim算法。针对不同维度的模式,各种算法特点不同。 相似文献
2.
李亮 《计算机工程与科学》2012,34(11):68
入侵检测系统是计算机安全体系中的一个重要构成要素,随着网络数据流量的不断增大,与数据挖掘相结合的入侵检测系统成为了研究热点。本文针对计算机入侵检测中网络安全审计数据的特点,提出了一个改进的PrefixSpan算法,并通过检测一个网络审计记录的实验,进行了结果分析。 相似文献
3.
4.
序列模式挖掘在网络业务流分析中的应用 总被引:2,自引:0,他引:2
网络业务流分析是为了适应网络优化的需要而出现的分析方法。把一种新的序列模式挖掘算法用于网络业务流分析,对网络业务的模式进行挖掘,性能上优于以往的算法。 相似文献
5.
序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。 相似文献
6.
传统数据挖掘算法在处理海量数据集时计算能力有限。为解决该问题,提出一种基于Map Reduce的分布式序列模式挖掘算法MR-PrefixSpan。在PrefixSpan算法的基础上,对模式挖掘任务进行分割,利用Map函数处理由不同前缀得到的序列模式,并行构造投影数据库,从而提高挖掘效率及简化搜索空间。采用Reduce函数对中间结果进行规约,得到全局序列模式。在Hadoop集群上的实验结果表明,MR-PrefixSpan能减少数据库扫描时间,具有较高的并行加速比和较好的可扩展性。 相似文献
7.
8.
9.
序列模式挖掘是数据挖掘中的研究热点之一,它是基于关联规则的频繁项集的挖掘,其实质是在关联模型中加入时间属性。本文利用序列模式挖掘的典型算法prefix算法对铝电解中重要的工艺参数数据进行挖掘分析,给出铝电解槽的重要的工艺参数的序列化,对于提高铝电解的生产效率,节能降耗,延长率电解槽的寿命具有重要的意义。 相似文献
10.
为了及时发现公路隧道内发生的事故隐患,尽量减少事故发生的不利影响,分析了隧道交通事件的分类与属性,阐述了现有交通事件检测技术用于隧道交通的不足,提出了一个基于序列模式挖掘的隧道交通事件检测系统,分析了系统各模块的基本功能。在系统的数据挖掘模块应用了关联规则和序列模式挖掘,分析了序列模式挖掘算法的具体应用,采用序列模式挖掘的PrefixS-pan算法生成隧道交通事件序列模式。实验表明,生成的模式反映了隧道交通事件的序列特征,可以用于建立隧道交通事件规则库。 相似文献
11.
序列模式挖掘中几种算法的缺点:都要进行多次扫描数据库,CPU要进行多次I/O操作.这成为序列挖掘中的一大瓶颈,使得算法在实际应用中的效率不高.文中提出一种矩阵算法,即在一次扫描数据库时,根据扫描数据建立由0和1组成的事务矩阵.接下来的大序列、序列模式等都是通过矩阵的列向量对应元素的相乘运算和简单的加法运算而得到.从而使算法得到进一步优化,提高了CPU的使用率,解决了序列挖掘中的瓶颈问题.本算法通过大量的数据实验,证明了算法确实有效地优化了算法的时间复杂度. 相似文献
12.
序列模式挖掘是数据挖掘的一个重要问题.传统的序列模式仅能揭示频繁出现的项目以及出现的顺序,但不能揭示在前续项目出现的情况下,后续项目出现的时间.在本文中,引入一种新的多时间粒度序列模式,模式中相邻项目之间的转换时间采用从原数据集中导出的、多时间粒度下的最小有界时间区间和平均时间标注.建立了多时间粒度序列模式挖掘模型,提出了一种新的多时间序列模式挖掘算法MG-PrefixSpan.实验表明,算法是有效的. 相似文献
13.
行程能否获得潜在旅游者的接受,是其业务能否成功展开的关键一步。本文介绍了Apriori算法,并在实践中对该算法做了改进,用改进后的类Apriori算法对旅游行程进行分析和优化。应用结果表明,该系统极大地提高了旅游行程的合理性,降低了旅游成本,提升了旅游服务质量。 相似文献
14.
序列模式挖掘算法研究 总被引:5,自引:0,他引:5
数据挖掘领域一个活跃的研究分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。目前的序列模式挖掘方法主要分为两类,一类是候选集生成-测试方法;另一类是模式扩展方法。先介绍序列模式挖掘中的基本概念,然后描述几个重要算法,最后给出性能分析。 相似文献
15.
数据挖掘领域一个活跃的研究分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。目前的序列模式挖掘方法主要分为两类,一类是候选集生成测试方法:另一类是模式扩展方法。先介绍序列模式挖掘中的基本概念,然后描述几个重要算法,最后给出性能分析。 相似文献
16.
对图书馆中的图书借阅数据库进行挖掘能给图书管管理人员提供许多有用信息。本文介绍了数据挖掘中的关联规则的基本概念,关联规则的挖掘过程,并给出了Apriori算法。以德州学院图书馆为例,分析了关联挖掘在图书馆中的应用。 相似文献
17.
为检测信息系统中日益增加的内部威胁,针对审计日志中角色行为特征进行分析处理,提出一种基于角色异常行为挖掘的内部威胁检测方法。根据序列模式挖掘原理挖掘角色正常行为,使用KMP算法进行模式匹配,判断角色当前行为是否存在异常。实验数据表明,该方法可有效实现对角色正常行为的挖掘和对角色异常行为的检测,减少模式挖掘时间,在异常行为检测精确度上有所提高。 相似文献
18.
使用序列模式精简基挖掘序列模式 总被引:3,自引:1,他引:3
传统的序列模式挖掘方法在挖掘由短的频繁序列模式组成的数据库时有良好的性能.但在挖掘长的序列模式或支持度阈值很低时,这些方法可能遇到固有的困难,因为产生的频繁序列模式的数量经常太大.在许多情况下,用户可能只需要那些覆盖许多短模式的长模式.此外,在很多应用中,只要得到产生的频繁序列模式的近似支持度就已足够,而不需要它们的精确支持度.介绍了能将误差控制在确定范围内的频繁序列模式精简基的概念,并开发了一个挖掘这种序列模式精简基的算法.实验结果显示计算频繁序列模式精简基是很有前途的. 相似文献
19.
为了研究患者在不同医院间的转诊行为模式, 可以使用序列模式挖掘算法. 类Apriori算法是序列模式挖掘中的常用算法, 但该算法存在一些不足之处, 如产生候选序列的数目较多、需要频繁扫描数据库. 针对类Apriori算法存在的不足, 本文提出了相应的改进措施, 采用新的剪枝策略并减少不必要的数据库扫描操作. 实验证明, 改进后的算法能更高效地挖掘频繁转诊序列. 相似文献
20.
序列模式挖掘是一项重要的数据挖掘任务,而Apriori算法是一种有效的关联规则挖掘方法,本文介绍了如何将Apriori算法应用于序列模式挖掘。 相似文献