首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于最长公共子序列距离的主旨模式挖掘算法   总被引:3,自引:1,他引:2       下载免费PDF全文
针对现有主旨模式挖掘算法易受噪声干扰的问题,提出一种基于最长公共子序列距离的挖掘算法。在搜索过程中,该算法采用基于子序列距离判别的策略进行了有效的剪枝,对于非等长的候选模式,使用最小描述长度原则求其相关权重,据此选择出现频率最高、最能体现原时间序列特征的主旨模式。实验结果表明,与朴素式搜索相比,该算法的速度至少提升60%。  相似文献   

2.
现有的时间序列异步周期模式挖掘方法是在获取1-pattern有效段及周期的基础上再以枚举法得到i-patterns,时间复杂度较高。为解决该问题,提出一种改进的异步周期模式挖掘方法。在时间序列符号化后,使用基于Sequitur的候选模式算法获取候选i-patterns及其事件位置序列,通过基于OEOP的i-patterns有效段生成算法得到1-pattern和i-patterns的有效段及周期,从而生成有效子序列。实验结果表明,该方法具有较高的挖掘效率。  相似文献   

3.
基于时间序列的模式表示挖掘频繁子模式   总被引:1,自引:0,他引:1  
论文提出了一种基于时间序列的模式表示挖掘时间序列中频繁子模式的算法(TSFSM)。时间序列的模式表示本身就具有压缩数据、保持时间序列基本形态的功能,并且具有一定的除噪能力。在时间序列的模式表示的基础上挖掘其频繁子模式,可以大大提高挖掘的效率和准确性,达到事半功倍的效果。在该算法中,还使用了一定的剪枝策略,使得算法的时间复杂度进一步降低。并且该算法计算简单,实现方便,可以支持时间序列的动态增长。  相似文献   

4.
超团模式挖掘是数据挖掘领域新的研究内容之一,极大超团模式挖掘是超团模式挖掘的扩展,在分析已有算法的基础上,提出了一种新的挖掘极大超团模式的算法。新算法在保持已有算法中有效剪枝策的基础上,针对基于FP-tree挖掘极大超团模式的特点,算法中增加了新的剪枝策略,并引入了极大超团模式树,用于保存极大超团模式和进行极大超团模式检测,实验表明新算法的正确性和有效性。  相似文献   

5.
时态数据库中数值型属性(项)的周期规律挖掘已经得到了研究,提出的方法能够计算时态数据库中某个非数值型属性的周期,并通过执行改造了的Apriori算法挖掘该属性的周期规律,与此同时,算法也能够提取时态数据库中其他属性的带时态信息的关联规则.提出的方法通过选取两个时间粒度,对时态数据库中的时间属性进行了两次划分和标记.通过划分和标记计算选出的某非数值型属性的周期;并用标记集合代替原时间区间,进行标记集合求交,根据求交的结果得到带时态信息的频繁项集.通过时间区间标记集合求交得到频繁项集的方法是一个特色.算法的这一特色使得Apriori算法的迭代过程迅速收敛,提高算法执行效率.  相似文献   

6.
在传统剪枝策略中,具有相同事务集的父子结点搜索空间没有充分剪枝,效率较低.为此,提出父子等价的剪枝策略.采用深度优先搜索集合枚举树,对于父子结点中具有相同事务集的搜索空间进行剪枝,有效地缩小搜索空间,减少频繁项计算的次数,给出基于该剪枝策略的最大频繁项集挖掘算法.实验结果表明,该算法可缩短同一支持度下的最大频繁项集挖掘时间.  相似文献   

7.
王璐  刘晓清  何震瀛 《计算机工程》2022,48(2):79-85+91
查询文本中频繁出现的短语可快速掌握文本内容,然而传统频繁词序列挖掘算法面向挖掘任务时的时间复杂度较高,无法满足频繁更换查询条件及快速获得反馈的查询需求。利用基于频率树的快速频繁词序列挖掘算法(TS_Mining),在保持后缀树线性构造时间的情况下实现文本集合中频繁词序列的查询,并采用树型索引结构避免多次扫描文本集合,降低算法时间复杂度。针对连续时间区间内的频繁词序列查询问题,提出改进的剪枝挖掘算法(TS_Pruning),通过减少频率树的扫描范围进一步提高挖掘效率。实验结果表明,TS_Mining与TS_Pruning算法的运行时间相比经典Apriori挖掘算法约减少了2个数量级,具有更高的频繁词序列挖掘效率。  相似文献   

8.
时序波动关联规则概念格并行挖掘的一个新算法   总被引:1,自引:0,他引:1  
基于概念格理论,研究了对时间序列的波动情况进行周期关联规则的挖掘.首先对时间序列进行了反季节化预处理,然后提出了生成周期关联规则的新并行算法,在算法内部对生成的概念进行了剪枝处理,有效地提高了挖掘速度.随后用所给出的高精度模型对不满足移动平均法反季节化预处理条件的时间序列进行了反季节化计算.实验证明了该方法的有效性.  相似文献   

9.
最短路径查询问题已被研究多年,然而,目前已有大部分工作主要集中在普通图上,针对时态图最短路径查询的研究工作相对较少.时态图中,2个顶点之间有多条边,每条边附带有时态区间,记录着边上代表事件的发生时间和结束时间.时态图最短路径查询在城市交通路径规划、社交网络分析、通信网络挖掘等领域有着广泛的应用.由于最短时态路径的子路径...  相似文献   

10.
肖波  张亮  徐前方  蔺志青  郭军 《软件学报》2010,21(4):659-671
超团模式是一种新型的关联模式,这种模式所包含的项目相互间具有很高的亲密度.超团模式中某个项目在事务中的出现很强地暗示了模式中其他项目也会相应地出现.极大超团模式是一组超团模式更加紧凑的表示,可被用于多种应用.挖掘这两种模式的标准算法是完全不同的.提出一种基于FP-tree(frequent pattern tree)的快速挖掘算法——混合超团模式增长(hybrid hyperclique pattern growth,简称HHCP-growth),统一了两种模式的挖掘.算法采用递归挖掘方法,并应用多种有效的剪枝策略.提出并证明几个相关命题来说明剪枝策略的有效性和算法的正确性.实验结果表明,HHCP-growth算法相对于标准的超团模式挖掘算法和极大超团模式挖掘算法都具有更高的效率,尤其对于大数据集或在低支持度条件下更为显著.  相似文献   

11.
丁勇  王云  李丛 《计算机系统应用》2014,23(12):202-205
事件序列上的频繁情节挖掘是时序数据挖掘领域的热点之一,基于非重叠发生的支持度定义,提出一个频繁情节挖掘算法NONEPI++,该算法首先通过情节串接产生候选情节,然后通过预剪枝和计算情节发生的时间戳来产生频繁情节.算法只需扫描事件序列一次,大大提高了情节挖掘的效率.实验证明,NONEPI++算法能有效地挖掘频繁情节.  相似文献   

12.
基于CTID序列模式的一种改进算法   总被引:2,自引:0,他引:2  
提高序列模式挖掘算法效率的关键在于减少发现频繁序列的时间。文中基于CTID概念提出了一种改进的频繁序列模式挖掘算法——SPM,它充分利用频繁项集和中间挖掘结果,得到更多有效的序列模式,并简化了剪枝步骤,从而提高了算法效率。实验证明该算法可行。  相似文献   

13.
时序图是一种边上带有时间戳的图结构,其中边上的时间戳表示该边出现时间,即图随时间变化不断变化.图数据中的稠密子图挖掘问题具有非常强烈的现实意义.目前,时序图中大多数现有的工作都集中在稠密子图检测问题,该问题目标是找到时序图中所有的目标子图.然而,当时序图的规模过大时,这一问题将变得极其复杂且收效甚微.旨在研究在时序图中...  相似文献   

14.
时间序列是一种得到广泛应用的数据对象,Bandt等人提出了一种基于排序的时间序列分析方法,它可以发现时间序列的周期,但是需要人工交互完成,且实验效果依赖于使用者的经验。因此提出了一种基于排序的时间序列周期自动检测算法,算法分为4个步骤:找出周期与其延迟成2倍关系的核图,再基于核图周期找出中心图,围绕核图进行适当的扩展找出外延图,结合三类不同的图给出3种策略下检测出的周期集合。应用算法对4个不同的数据集进行了实验研究,并与AutoPeriod方法进行了分析比较,对比结果显示了算法的高准确性,并以基于核图和中心图计算周期效果最好。  相似文献   

15.
基于时间戳数据库的分布式多层时态关联规则挖掘   总被引:1,自引:0,他引:1  
为了解决目前企业急需的交叉销售问题,提出了基于时间戳数据库的分布式多层时态关联规则挖掘问题,并实现了解决该问题的核心算法DMTARM。该算法减少了数据库的扫描次数,提高了内存的使用效率和通信效率。  相似文献   

16.
基于小波的时间序列流伪周期检测方法   总被引:1,自引:0,他引:1  
李晓光  宋宝燕  于戈  王大玲 《软件学报》2010,21(9):2161-2172
提出一种有效的时间序列流伪周期检测方法MPD(memory-constrain period detection).它采用Haar小波技术构建时间序列流大纲,利用部分片段估计周期方法提高检测效率,采用基于三次插值的周期估计方法检测任意长度的周期.通过对MPD误差的理论分析和实验分析,验证了MPD的时间和空间复杂度以及检测误差的有效性.  相似文献   

17.
邹兆年  高宏  李建中  张硕 《软件学报》2010,21(5):1007-1019
探讨演变图(即随时间变化的图)的挖掘,重点研究在演变图中挖掘连接子图的演变模式集合.提出一种连接子图的相似度函数及其快速计算算法.基于该相似度函数,提出一种发现演变模式集合的多项式时间复杂度的动态规划算法.模拟数据集上的实验结果表明,该算法具有较低的误差率和较高的效率.真实数据集上的实验结果表明,挖掘结果在真实应用中具有实际意义.  相似文献   

18.
王齐童  王鹏  赵郁亮  汪卫 《计算机工程》2020,46(4):97-106,122
从时空维度中寻找轨迹相似、时间相近的对象集合,即挖掘移动对象的伴随模式,在基于地理位置的用户行为分析中被广泛使用.然而现有移动对象相似性挖掘算法难以处理时间连续、空间离散、时空相关并且数据量大的时空数据.针对此类数据,设计基于滑动窗口、Apriori性质和贪心选择策略的宽度优先搜索算法,对移动对象伴随模式挖掘问题进行求解.同时结合基于哈希的迭代剪枝算法和基于摘要信息的剪枝算法,设计两层剪枝算法以去除冗余的中间结果.在真实数据上的实验结果表明,与仅使用哈希迭代或摘要信息的剪枝算法相比,该算法的剪枝效率较高,并且能够稳定去除99%以上的冗余数据.  相似文献   

19.
数据挖掘过程中只考虑数据项权重或者只考虑时态语义会导致挖掘结果不全面。针对该问题,对加权关联规则、时态关联规则和时态数据周期规律进行研究,将权值、K-支持期望和周期等概念引入到时态关联规则中,提出一种基于周期规律的加权时态关联规则挖掘算法。以某管理系统审计数据为例进行实验验证,结果表明该算法能够准确地挖掘出数据库中的加权时态关联规则,与加权关联规则算法相比,在时间复杂度相同的情况下能使关联规则的挖掘结果更加全面。  相似文献   

20.
频繁子图挖掘是各种图挖掘的基础和瓶颈,为了提高频繁子图挖掘算法的效率,在频繁闭图方法的基础上提出了一种新算法BPCG.首先使用了一种新结构表存储频繁子图集,从而不需扫描图集就可直接扩展最频繁邻接边及计算支持度阈值;然后算法又利用兄弟剪枝策略和删除局部频繁边,缩小搜索空间并减少不必要的操作.通过实验证明,算法优于其他子图挖掘算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号