首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
结构关系模式挖掘是本课题组提出的一种新的数据挖掘理论,主要研究序列之间的并发关系、互斥关系、重复关系等.并发序列模式挖掘是结构关系模式挖掘的重要组成部分.文中从序列间的相对关系出发研究并发关系,给出并发序列模式的相关性质,并对现有并发序列模式挖掘算法进行优化.通过实验对比可以看出:该算法根据并发序列模式的反单调特性和非平凡特性,对挖掘结果进行大幅精简,使得挖掘更有实际意义.  相似文献   

2.
序列挖掘算法产生冗余序列,造成其运行时间过长.对此,提出了一种新的闭合序列挖掘算法——时序关系下的闭合序列模式挖掘算法.依据闭合序列模式的性质,通过比较频繁序列与每个1-项频繁序列之间的时序关系,推断频繁序列模式是否可扩展.基于IBM公司的合成数据,将其与闭合序列模式挖掘算法进行比较,实验结果表明,这种新的闭合序列挖掘算法可以有效降低运行时间且不易受到属性值个数的影响.  相似文献   

3.
在并发序列模式挖掘基础上进一步挖掘偏序关系模式,讨论相关度、有序度、有序关系序列、偏序关系和偏序关系模式等概念,给出基于并发序列模式的偏序模式挖掘方法,该方法利用并发和偏序之间的联系,应用并发与偏序之间的包含关系,有效的在并发序列模式的基础上得到偏序关系模式.  相似文献   

4.
基于序列模式图可以定义某些结构化的新知识,如分支模式、重复模式以及它们的组合——结构模式.在基于事件的数据或序列数据中发现结构模式是后序列模式挖掘的任务.基于Apriori算法思想,介绍结构模式的主要形式——并发分支模式及其挖掘算法,并通过示例解释挖掘算法的实现过程.该算法的基本思想是在粗并发分支模式的基础上生成并发分支模式,在并发分支模式生成过程中采用自底向上的方法.基于Apriori的并发分支模式挖掘算法的提出为进一步挖掘结构模式提供了重要的理论支持.  相似文献   

5.
把数据挖掘应用到SNP和单体型分析,采用数据挖掘的方法得到SNP位点序列和单体型序列,从结构关系模式挖掘的角度,分析SNP位点之间、单体型之间可能存在的结构关系.并为用结构关系模式挖掘分析SNP和单体型之间的结构关系奠定基础.  相似文献   

6.
Web日志中时态约束浏览模式挖掘算法研究   总被引:1,自引:0,他引:1  
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.  相似文献   

7.
序列模式挖掘是数据挖掘中的一个重要研究方向,对序列模式挖掘中的4种算法(AprioriAll、 GSP、 FreeSpan 、Prefixspan)的执行过程及其特点进行了研究,并对这几种算法的时空执行效率进行了定性和定量的分析比较,指出了4种算法各自的适用范围,得出的结果对序列模式挖掘系统的设计具有一定的参考价值。  相似文献   

8.
在前期研究工作的基础上,研究在单序列中序列模式的概念,讨论了相关的性质,这些概念和性质与多序列情况有很大的不同.在此基础上给出了在单序列中基于滑动窗口概念挖掘序列模式的方法及相关算法,为进一步研究序列模式及其挖掘算法提供了一定的理论基础.  相似文献   

9.
引入序列模式时间特征的概念,提出一个带时间约束的序列模式挖掘算法,称做TESP(Time-Enriched Sequential Pattern mining),算法在找出模式的同时,也给出序列模式的时间特征,并且允许用户在挖掘之前对模式的这些时间特征进行限制,提高了序列模式挖掘的灵活性和有用性。  相似文献   

10.
与布尔型数据的频繁模式挖掘相比,时间序列的频繁模式挖掘是一个相对复杂的问题,目前对此类问题还缺少深入的研究.通过对小波滤波的研究,提出了一种时间序列的频繁模式挖掘算法,Frequent-Wavelet算法.该算法的特点是采用多孔平滑滤波器组对时间序列做低通平滑处理,用得到的多个尺度序列表示原序列,较好地解决了时间序列的平凡相似问题和时间轴伸缩问题.实验表明,Frequent-Wavelet算法对于时间序列的频繁模式挖掘具有较好的效果.  相似文献   

11.
针对开放文本中中文实体关系抽取的一词多义问题,提出一种基于实体消歧的中文实体关系抽取方法。首先,从知网中挖掘出具有潜在语义关系的实体对,并利用贝叶斯分类的语义消歧方法实现从知网到维基百科的实体映射,以获取高质量的关系实例;然后,根据这些关系实例抽取出其对应文本中共现的句子实例,构建基本的抽取模式;最后通过模式合并的方法生成新模式,再使用新模式来抽取新实例。实验结果表明,该方法与没有进行语义消歧和模式合并的方法相比准确率有所提高。  相似文献   

12.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,使得在通信网环境下挖掘关联规则的难度非常大。针对上述问题,提出了一种基于分层频繁模式树的LFPTDP算法,采用分层模式树的方法产生频繁项集,从而避免了产生大量的条件模式树,并用动态剪枝的方法删除大量的非频繁项。算法分析及仿真表明,LFPTDP算法具有较好的时间和空间效率,是一种适合于通信网告警相关性分析的关联规则挖掘算法。  相似文献   

13.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

14.
给出了关系数据库模型的数学基本概念,如N元关系、N元有序组及N元有序组集合。从N元关系导出关系模型,比较了关系模型与N元关系之间的异同,及N元关系与关系模型的联系。  相似文献   

15.
频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号。通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式。实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少。  相似文献   

16.
针对句法模式泛化这个具体问题,比较了几种常见的处理方法,提出自己的处理方案,并将其用于关系学习中。实验结果表明,所提出的泛化方法可以有效地解决模式泛化问题,抽取出多种语义关系实例。  相似文献   

17.
基于模糊逻辑的群体信任模型   总被引:1,自引:0,他引:1  
从信任的主观性和模糊性角度出发,提出了一种基于模糊逻辑的群体信任模型,抽象出顺序模式、选择模式、循环模式和并行模式4种群体构成的基本约束模式及其嵌套复合来刻画群体中个体之间的约束关系,并分别给出了信任度的度量方法.群体信任模型对群体信任关系和特别软件群体的信任关系提供了很好的支持.  相似文献   

18.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号