共查询到20条相似文献,搜索用时 595 毫秒
1.
对现有最大序列模式挖掘算法候选序列模式过多以及可扩展性差的缺点,提出了一种基于序列匹配的最大序列模式挖掘算法CSMS(compare sequence finding maximal sequential pattern).算法首先为所有频繁1序列构建位置信息表;然后利用纵向、横向结合搜索位置信息表的序列扩展匹配方法找到潜在最大序列模式;在进行序列匹配扩展的同时,把每个找到的潜在最大序列模式存储在改进的前缀树PStree(prefix sequential pattern tree)中,树中每个结点链接到索引Hash表,Hash表中保存了结点的位置信息,对于那些重复的序列可以直接从Hash表中找到其位置信息;最后通过对前缀树PStree进行剪枝,得到由最大序列模式组成的前缀树MPStree(maximal sequential pattern tree).实验结果表明算法CSMS具有较好的时间效率和扩展性. 相似文献
2.
为了能够有效地利用滑动窗口技术来挖掘数据流当中的频繁闭序列模式,通过构建CST树(closed sequence tree)来保存频繁闭序列模式及其序列之间的关联关系,研究了滑动窗口在流数据上滑动时,窗口内序列属性以及CST树节点相互关系的变化性质,提出了基于滑动窗口的数据流闭序列模式挖掘算法ECSW(efficient closed sequential pattern mining over streamsliding window)。ECSW充分利用CST树内节点的相互关系,减少了对数据库的扫描,并且能够在不借助其他辅助结构的情况下完成CST树节点的更新。比较了ECSW与SeqStream在不同实验参数下的挖掘效果,实验结果表明,在平均闭序列长度不长时,ECSW有着比SeqStream更好的运行效果。 相似文献
3.
一种挖掘压缩序列模式的有效算法 总被引:1,自引:0,他引:1
从序列数据库中挖掘频繁序列模式是数据挖掘领域的一个中心研究主题,而且该领域已经提出和研究了各种有效的序列模式挖掘算法.由于在挖掘过程中会产生大量的频繁序列模式,最近许多研究者已经不再聚焦于序列模式挖掘算法的效率,而更关注于如何让用户更容易地理解序列模式的结果集.受压缩频繁项集思想的启发,提出了一种CFSP(compressing frequent sequential patterns)算法,其可挖掘出少量有代表性的序列模式来表达全部频繁序列模式的信息,并且清除了大量的冗余序列模式.CFSP是一种two-steps的算法:在第1步,其获得了全部闭序列模式作为有代表性序列模式的候选集,与此同时还得到大多数的有代表性模式;在第2步,该算法只花费了少量的时间去发现剩余的有代表性序列模式.一个采用真实数据集与模拟数据集的实验研究也证明了CFSP算法具有高效性. 相似文献
4.
为解决传统频繁模式挖掘算法效率不高的问题,提出了一种改进的基于FP-tree (Frequent pattern tree)的Apriori频繁模式挖掘算法.首先,在Apriori算法的连接步加入连接预处理过程;其次,对CP-tree (Compact Pattern tree)进行扩展,构造了一个新的树结构ECP-tree (Extension of Compact Pattern tree),新的树结构只需对数据库进行一次扫描就能构造出一棵紧凑的前缀树,且支持交互式挖掘与增量挖掘;然后,将改进点与APFT算法结合,用于挖掘频繁模式;最后,使用UCI数据库中两个数据集进行实验.实验结果表明:改进算法具有较高的挖掘效率,频繁模式挖掘速度显著提升. 相似文献
5.
提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项集,由得到的频繁1-项集开始,循环的由频繁(k-1)-项集(k>1)连接生成频繁k项集,从而得到所有的多维模式。该算法通过扫描不断缩小的频繁(k-1)-项集来生成频繁k项集,减少了扫描投影数据库的次数,因而减少了时间开销,实验表明该算法有较高的挖掘效率。 相似文献
6.
7.
序列数据中可能包含大量敏感信息,因此直接对序列数据的频繁模式进行挖掘存在泄露用户隐私信息的风险。本地化差分隐私(LDP)能够抵御具有任意背景知识的攻击者,可以对敏感信息提供更全面的保护。序列数据内在序列性和高维度的特点为LDP应用于频繁序列模式挖掘带来了挑战。为解决这个问题,提出一种满足ε-LDP的top-k频繁序列模式挖掘算法PrivSPM。该算法结合填充和采样技术、自适应频率估计算法与频繁项预测技术来构造候选集;基于新域,利用基于指数机制的策略对用户数据进行扰动,并结合频率估计算法识别最终的频繁序列模式。理论分析证明了该算法满足ε-LDP。在3个真实数据集上的实验结果表明,PrivSPM算法在纳真率(TPR)和归一化累积排名(NCR)上明显高于对比算法,能有效提高挖掘结果的准确度。 相似文献
8.
9.
针对现有基于差分隐私的频繁轨迹模式挖掘算法全局敏感度过高、挖掘结果可用性较低的问题,提出一种基于前缀序列格和轨迹截断的差分隐私下频繁轨迹模式挖掘算法--LTPM。该算法首先利用自适应的方法获得最优截断长度,然后采用一种动态规划的策略对原始数据库进行截断处理,在此基础上,利用等价关系构建前缀序列格,并挖掘频繁轨迹模式。理论分析表明LTPM算法满足ε-差分隐私;实验结果表明,LTPM算法的准确率(TPR)和平均相对误差(ARE)明显优于N-gram和Prefix算法,能有效提高挖掘结果的可用性。 相似文献
10.
基于CTID序列模式的一种改进算法 总被引:2,自引:0,他引:2
提高序列模式挖掘算法效率的关键在于减少发现频繁序列的时间。文中基于CTID概念提出了一种改进的频繁序列模式挖掘算法——SPM,它充分利用频繁项集和中间挖掘结果,得到更多有效的序列模式,并简化了剪枝步骤,从而提高了算法效率。实验证明该算法可行。 相似文献
11.
计算机病毒的保守模式分析 总被引:1,自引:0,他引:1
计算机病毒对计算机世界造成的威胁与日俱增。尽管各种防毒措施,如防病毒软件和入侵检测系统为人们提供了某些帮助,但它们对付计算机病毒的能力有限,存在着检测效率低、病毒的特征检测标识库经常发生变化等问题。该文针对这些问题,通过对计算机病毒的结构和运行机制的研究,提出了计算机病毒的保守模式的概念,并对这一概念进行了深入的分析,如病毒的搜索模式和自我复制模式等。这些模式的描述为病毒的检测和识别,尤其是新型病毒的有效检测提供了一条新的途径。 相似文献
12.
13.
约束优化模式搜索法研究进展 总被引:9,自引:1,他引:8
实际工程应用中的优化问题通常包含复杂的约束条件,其目标函数可能是非线性、非连续、不可微甚至随机函数;而约束函数可能是线性、非线性、离散变量集,甚至黑盒函数(例如,由程序代码生成的值集合);约束变量也可能是包含连续、离散或分类值的混合变量.这些复杂的情况,使得没有任何导数/梯度信息可供利用,因此无法利用现有的凸优化技术求解.文中研究如何利用模式搜索法对常见的混合变量约束优化模型进行求解.首先对直接搜索法的发展历史进行概述;特别地,给出模式搜索法统一的数学描述和收敛性分析.对约束条件从无约束(一般模式搜索)到线性约束(广义模式搜索GPS)、非线性约束(GPS过滤法)和混合约束(广义混合变量规划GMVP)的推广以及在边界约束条件下,算法搜索方向从有限集向紧致集的扩展(网格自适应直接搜索MADS),进行了全面分析;在此基础上对该领域尚存在的问题及进一步的研究方向进行了总结. 相似文献
14.
提出了一种改进的自适应快速整像素搜索算法。算法使用CSP进行粗定位搜索,并且根据分割块的尺寸,在SDSP和SSSP中选择合适的模板作为精确定位搜索的模板。为了进一步减少搜索点数,在粗定位搜索过程中加入由补偿数据和3个相邻块的SAD值确定的判断阈值,实现阈值的自适应变化。实验结果显示,与UMHSA和DSA相比,算法的搜索速率有较大的提高,同时亮度信号的平均峰值信噪比和编码字节数的变化不大。 相似文献
15.
为了降低快速运动估计的计算复杂度,避免小菱形搜索算法带来的局部最优点问题,提出了自适应搜索模板的估计算法.该算法在搜索时根据SAD值的变化快慢和相邻帧之间时间相关性自适应选择搜索模板.实验表明,使用该算法编码,码流大小与使用菱形搜索算法和六边形搜索算法差距为±0.6%,搜索点数为菱形算法的72%~77%,六边形算法的83%~86%.在减少搜索点数的情况下有效地避免了局部最优点问题. 相似文献
16.
17.
The discovery of diversity patterns from binary data is an important data mining task. In this paper, we propose the problem of mining highly diverse patterns called non-redundant diversity patterns (NDPs). In this framework, entropy is adopted to measure the diversity of itemsets. In addition, an algorithm called NDP miner is proposed to exploit both monotone properties of entropy diversity measure and pruning power for the efficient discovery of non-redundant diversity patterns. Finally, our experimental results are given to show that the NDP miner can efficiently identify non-redundant diversity patterns. 相似文献
18.
In this paper, a new pattern search is proposed to solve the systems of nonlinear equations. We introduce a new non-monotone strategy which includes a convex combination of the maximum function of some preceding successful iterates and the current function. First, we produce a stronger non-monotone strategy in relation to the generated strategy by Gasparo et al. [Nonmonotone algorithms for pattern search methods, Numer. Algorithms 28 (2001), pp. 171–186] whenever iterates are far away from the optimizer. Second, when iterates are near the optimizer, we produce a weaker non-monotone strategy with respect to the generated strategy by Ahookhosh and Amini [An efficient nonmonotone trust-region method for unconstrained optimization, Numer. Algorithms 59 (2012), pp. 523–540]. Third, whenever iterates are neither near the optimizer nor far away from it, we produce a medium non-monotone strategy which will be laid between the generated strategy by Gasparo et al. [Nonmonotone algorithms for pattern search methods, Numer. Algorithms 28 (2001), pp. 171–186] and Ahookhosh and Amini [An efficient nonmonotone trust-region method for unconstrained optimization, Numer. Algorithms 59 (2012), pp. 523–540]. Reported are numerical results of the proposed algorithm for which the global convergence is established. 相似文献
19.
20.
Tabu搜索在特征选择中的应用 总被引:25,自引:0,他引:25
研究利用Tabu搜索从大特征集中选择一组有效特征的问题.分析了Tabu搜索中
表长、邻域大小和候选解数量等参数对Tabu搜索的影响.对两种特征选择的问题,与经典及
最近新提出的一些特征选择方法如SFS,SBS,GSFS,GSBS,PTA,BB,GA和SFFS,SFBS等
算法的实验比较表明,Tabu搜索在求解时间和解的质量上都取得了满意的结果. 相似文献