首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 595 毫秒
1.
对现有最大序列模式挖掘算法候选序列模式过多以及可扩展性差的缺点,提出了一种基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先为所有频繁1序列构建位置信息表;然后利用纵向、横向结合搜索位置信息表的序列扩展匹配方法找到潜在最大序列模式;在进行序列匹配扩展的同时,把每个找到的潜在最大序列模式存储在改进的前缀树PStree(prefix sequential pattern tree)中,树中每个结点链接到索引Hash表,Hash表中保存了结点的位置信息,对于那些重复的序列可以直接从Hash表中找到其位置信息;最后通过对前缀树PStree进行剪枝,得到由最大序列模式组成的前缀树MPStree(maximal sequential pattern tree).实验结果表明算法CSMS具有较好的时间效率和扩展性.  相似文献   

2.
黄钧钧  谢伙生 《计算机工程与设计》2011,32(6):2040-2044,2049
为了能够有效地利用滑动窗口技术来挖掘数据流当中的频繁闭序列模式,通过构建CST树(closed sequence tree)来保存频繁闭序列模式及其序列之间的关联关系,研究了滑动窗口在流数据上滑动时,窗口内序列属性以及CST树节点相互关系的变化性质,提出了基于滑动窗口的数据流闭序列模式挖掘算法ECSW(efficient closed sequential pattern mining over streamsliding window)。ECSW充分利用CST树内节点的相互关系,减少了对数据库的扫描,并且能够在不借助其他辅助结构的情况下完成CST树节点的更新。比较了ECSW与SeqStream在不同实验参数下的挖掘效果,实验结果表明,在平均闭序列长度不长时,ECSW有着比SeqStream更好的运行效果。  相似文献   

3.
一种挖掘压缩序列模式的有效算法   总被引:1,自引:0,他引:1  
从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集.受压缩频繁项集思想的启发,提出了一种CFSP(compressing frequent sequential patterns)算法,其可挖掘出少量有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式.CFSP是一种two-steps的算法:在第1步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第2步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性.  相似文献   

4.
为解决传统频繁模式挖掘算法效率不高的问题,提出了一种改进的基于FP-tree (Frequent pattern tree)的Apriori频繁模式挖掘算法.首先,在Apriori算法的连接步加入连接预处理过程;其次,对CP-tree (Compact Pattern tree)进行扩展,构造了一个新的树结构ECP-tree (Extension of Compact Pattern tree),新的树结构只需对数据库进行一次扫描就能构造出一棵紧凑的前缀树,且支持交互式挖掘与增量挖掘;然后,将改进点与APFT算法结合,用于挖掘频繁模式;最后,使用UCI数据库中两个数据集进行实验.实验结果表明:改进算法具有较高的挖掘效率,频繁模式挖掘速度显著提升.  相似文献   

5.
一种挖掘多维序列模式的有效方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项集,由得到的频繁1-项集开始,循环的由频繁(k-1)-项集(k>1)连接生成频繁k项集,从而得到所有的多维模式。该算法通过扫描不断缩小的频繁(k-1)-项集来生成频繁k项集,减少了扫描投影数据库的次数,因而减少了时间开销,实验表明该算法有较高的挖掘效率。  相似文献   

6.
孙蕾  朱玉全 《计算机工程》2006,32(11):95-96,99
如何确定候选频繁序列模式以及如何计算它们的支持数是序列模式挖掘中的两个关键问题。该文提出了一种基于二进制形式的候选频繁序列模式生成和相应的支持数计算方法,该方法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该方法与频繁序列模式挖掘及更新算法相结合,可以进一步提高算法的执行效率。  相似文献   

7.
序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。  相似文献   

8.
传统的类Apriori频繁序列模式挖掘算法都是基于支持度框架理论,需要预先设定支持度阈值,而这通常需要较深的领域知识或大量的实践,因此目前仍没有一种很好的设定方法.同时,序列模式的挖掘结果往往数量很大且不易理解,可用性较低.针对上述问题,提出了一种基于逻辑的频繁序列模式挖掘算法即LFSPM算法,并首次在频繁序列模式挖掘算法中引入了逻辑的思想,通过逻辑规则过滤,大大优化了结果集.实验证明,该算法较好地解决了支持度设置问题及挖掘结果可理解性不高的问题.  相似文献   

9.
金凯忠  彭慧丽  张啸剑 《计算机应用》2017,37(10):2938-2945
针对现有基于差分隐私的频繁轨迹模式挖掘算法全局敏感度过高、挖掘结果可用性较低的问题,提出一种基于前缀序列格和轨迹截断的差分隐私下频繁轨迹模式挖掘算法--LTPM。该算法首先利用自适应的方法获得最优截断长度,然后采用一种动态规划的策略对原始数据库进行截断处理,在此基础上,利用等价关系构建前缀序列格,并挖掘频繁轨迹模式。理论分析表明LTPM算法满足ε-差分隐私;实验结果表明,LTPM算法的准确率(TPR)和平均相对误差(ARE)明显优于N-gram和Prefix算法,能有效提高挖掘结果的可用性。  相似文献   

10.
基于CTID序列模式的一种改进算法   总被引:2,自引:0,他引:2  
提高序列模式挖掘算法效率的关键在于减少发现频繁序列的时间。文中基于CTID概念提出了一种改进的频繁序列模式挖掘算法——SPM,它充分利用频繁项集和中间挖掘结果,得到更多有效的序列模式,并简化了剪枝步骤,从而提高了算法效率。实验证明该算法可行。  相似文献   

11.
计算机病毒的保守模式分析   总被引:1,自引:0,他引:1  
计算机病毒对计算机世界造成的威胁与日俱增。尽管各种防毒措施,如防病毒软件和入侵检测系统为人们提供了某些帮助,但它们对付计算机病毒的能力有限,存在着检测效率低、病毒的特征检测标识库经常发生变化等问题。该文针对这些问题,通过对计算机病毒的结构和运行机制的研究,提出了计算机病毒的保守模式的概念,并对这一概念进行了深入的分析,如病毒的搜索模式和自我复制模式等。这些模式的描述为病毒的检测和识别,尤其是新型病毒的有效检测提供了一条新的途径。  相似文献   

12.
提出了一种解决无约束连续空间优化问题的蚁群协同模式搜索算法.该算法通过目标函数值启发式信息素引导群体进行区域搜索,而每个个体的模式搜索为算法提供进一步的局部搜索,其搜索结果以信息素融合的方式进行信息共享,为下一次的区域搜索提供依据.通过随机模式搜索算法理论得出了算法的收敛性定理.详细的测试结果体现算法的涌现智能特征,与其他算法的比较结果说明了算法的有效性及群体协同的优势.  相似文献   

13.
约束优化模式搜索法研究进展   总被引:9,自引:1,他引:8  
实际工程应用中的优化问题通常包含复杂的约束条件,其目标函数可能是非线性、非连续、不可微甚至随机函数;而约束函数可能是线性、非线性、离散变量集,甚至黑盒函数(例如,由程序代码生成的值集合);约束变量也可能是包含连续、离散或分类值的混合变量.这些复杂的情况,使得没有任何导数/梯度信息可供利用,因此无法利用现有的凸优化技术求解.文中研究如何利用模式搜索法对常见的混合变量约束优化模型进行求解.首先对直接搜索法的发展历史进行概述;特别地,给出模式搜索法统一的数学描述和收敛性分析.对约束条件从无约束(一般模式搜索)到线性约束(广义模式搜索GPS)、非线性约束(GPS过滤法)和混合约束(广义混合变量规划GMVP)的推广以及在边界约束条件下,算法搜索方向从有限集向紧致集的扩展(网格自适应直接搜索MADS),进行了全面分析;在此基础上对该领域尚存在的问题及进一步的研究方向进行了总结.  相似文献   

14.
提出了一种改进的自适应快速整像素搜索算法。算法使用CSP进行粗定位搜索,并且根据分割块的尺寸,在SDSP和SSSP中选择合适的模板作为精确定位搜索的模板。为了进一步减少搜索点数,在粗定位搜索过程中加入由补偿数据和3个相邻块的SAD值确定的判断阈值,实现阈值的自适应变化。实验结果显示,与UMHSA和DSA相比,算法的搜索速率有较大的提高,同时亮度信号的平均峰值信噪比和编码字节数的变化不大。  相似文献   

15.
基于自适应搜索模板的快速运动估计算法   总被引:1,自引:1,他引:0       下载免费PDF全文
为了降低快速运动估计的计算复杂度,避免小菱形搜索算法带来的局部最优点问题,提出了自适应搜索模板的估计算法.该算法在搜索时根据SAD值的变化快慢和相邻帧之间时间相关性自适应选择搜索模板.实验表明,使用该算法编码,码流大小与使用菱形搜索算法和六边形搜索算法差距为±0.6%,搜索点数为菱形算法的72%~77%,六边形算法的83%~86%.在减少搜索点数的情况下有效地避免了局部最优点问题.  相似文献   

16.
随着互联网的飞速发展和目前传统搜索引擎存在的各种弊端,个性化搜索引擎的出现成为了一个必然;同时随着信息过载问题的出现,个性化推荐系统也已成为了不少领域关注的热点。本文将个性化推荐系统与个性化搜索引擎相结合,将推荐模式引入个性化搜索引擎中,研究并设计一个基于模式推荐的个性化搜索引擎。  相似文献   

17.
The discovery of diversity patterns from binary data is an important data mining task. In this paper, we propose the problem of mining highly diverse patterns called non-redundant diversity patterns (NDPs). In this framework, entropy is adopted to measure the diversity of itemsets. In addition, an algorithm called NDP miner is proposed to exploit both monotone properties of entropy diversity measure and pruning power for the efficient discovery of non-redundant diversity patterns. Finally, our experimental results are given to show that the NDP miner can efficiently identify non-redundant diversity patterns.  相似文献   

18.
In this paper, a new pattern search is proposed to solve the systems of nonlinear equations. We introduce a new non-monotone strategy which includes a convex combination of the maximum function of some preceding successful iterates and the current function. First, we produce a stronger non-monotone strategy in relation to the generated strategy by Gasparo et al. [Nonmonotone algorithms for pattern search methods, Numer. Algorithms 28 (2001), pp. 171–186] whenever iterates are far away from the optimizer. Second, when iterates are near the optimizer, we produce a weaker non-monotone strategy with respect to the generated strategy by Ahookhosh and Amini [An efficient nonmonotone trust-region method for unconstrained optimization, Numer. Algorithms 59 (2012), pp. 523–540]. Third, whenever iterates are neither near the optimizer nor far away from it, we produce a medium non-monotone strategy which will be laid between the generated strategy by Gasparo et al. [Nonmonotone algorithms for pattern search methods, Numer. Algorithms 28 (2001), pp. 171–186] and Ahookhosh and Amini [An efficient nonmonotone trust-region method for unconstrained optimization, Numer. Algorithms 59 (2012), pp. 523–540]. Reported are numerical results of the proposed algorithm for which the global convergence is established.  相似文献   

19.
基于单纯形算子的混合遗传算法   总被引:11,自引:2,他引:9  
通过遗传算法(GA)与传统单纯形搜索法相结 合,并基于对遗传算法算子计算结构的调整,提出一种针对非线性规划问题的新算法——基 于单纯形算子的混合遗传算法(HGA),仿真结果验证了这种新算法的有效性和合理性.  相似文献   

20.
Tabu搜索在特征选择中的应用   总被引:25,自引:0,他引:25  
研究利用Tabu搜索从大特征集中选择一组有效特征的问题.分析了Tabu搜索中 表长、邻域大小和候选解数量等参数对Tabu搜索的影响.对两种特征选择的问题,与经典及 最近新提出的一些特征选择方法如SFS,SBS,GSFS,GSBS,PTA,BB,GA和SFFS,SFBS等 算法的实验比较表明,Tabu搜索在求解时间和解的质量上都取得了满意的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号