首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
提出一种改进的AC_BMH算法。该算法利用双字符进行跳跃,可以在增大模式串失配概率的同时跳过更大的距离,通过结合QS算法进一步增加模式串匹配失败时的跳跃距离,并借助压缩存储机制降低内存的使用量。实验结果表明,相比原AC_BMH算法,改进算法的字符串匹配速度提高了29%~52%,在模式串较多时,内存使用量可减少90%。  相似文献   

2.
基于KMP算法的改进算法KMPP   总被引:1,自引:0,他引:1  
KMP算法和BM算法是经典的单模式匹配算法,但KMP算法中文本指针[i]每次只能移动一个字符,整体的匹配效率并不高,结合KMP算法和BM算法的优点提出一种改进算法(KMPP)。算法的思想是模式串与文本在[j]处不匹配时,预算出模式串移动[next[j]]后末字符在文本中的位置,当该位置的文本字符与末字符不匹配时,则用该字符进行坏字符匹配,这两步的跳跃距离就是文本指针[i]移动的距离,从而使指针[i]每次移动的距离达到最大。实验结果表明,该算法匹配次数远低于KMP算法的匹配次数,提高了模式匹配的效率。  相似文献   

3.
在不同关键词规模、最短关键词长度和字符集大小等情况下,有效的多串匹配算法是不同的。新提出的自适应多串匹配算法(Adapted Multiple Strings Matching Algorithm,AMSM)改善了SBOM算法中Oracle树存在不精确跳跃计算的缺点,同时采用了WuManber算法的块跳跃策略和压缩形式的Oracle树比较策略,提高了算法的性能,可适用于各种情况,是一种通用多串(多模式)匹配算法。  相似文献   

4.
《微型机与应用》2014,(19):8-11
在研究了Wu_Manber算法及其已有改进的基础上,在跳跃距离、匹配过程和并行处理三方面进行了综合改进。改进后的算法跳跃距离最大能达到m+1,有效减少匹配过程中的比较次数,最后充分利用现有的硬件处理能力,进行并行处理,避免模式串集合过度增加后算法效率的下降问题,提高超大文本串的扫描速度。  相似文献   

5.
在比特流的模式匹配中,由于目标串和模式串字符集简单,匹配过程中匹配窗口平均跳跃长度短,导致快速搜索(QS)匹配算法效率不高。为此,分析QS算法坏字符启发规则匹配效率与字符集大小的关系,借鉴编码QS算法的编码思想,提出一种对模式串进行分组预处理并使用字符组计算跳跃集的分组QS算法,给出坏字符组启发规则与最佳分组长度的计算方法。实验结果表明,与不分组的算法相比,该算法能够增加比特流模式串匹配中匹配窗口的平均跳跃长度,提高计算效率。  相似文献   

6.
王浩  张霖 《计算机应用与软件》2012,29(5):114-116,129
提出一种基于坏字符序检测的快速模式匹配算法(BCSBM)。该算法利用相邻字符序列在模式串中不出现的概率较单字符高的特性,基于好字符和坏字符序表实现字符匹配过程的"跳跃"。BCSBM算法显著减少了匹配窗口内字符的匹配次数,同时增大了匹配窗口的平均移动距离。算法的实际测试效率较高,在文本或模式串相对较长的情况下该算法的效率提高明显。  相似文献   

7.
郝春媚  杨榆 《软件》2013,(9):57-60
模式匹配算法是涉密检查系统搜索引擎中的主要算法。在分析比较常用模式匹配算法基础上,提出了一种基于KMP算法跳跃思想的多模式匹配算法。该算法可兼容多模式匹配情况和单模式匹配情况,引入多维数组存储模式集并对模式集进行简单排序处理以简化后续操作,引入棋盘表记录各模式串的最大跳跃距离及模式串间跳跃距离。实验结果表明,该算法易于实现,并能有效提高匹配速度,对海量数据检索,有较好的时间和空间性能。  相似文献   

8.
一种串匹配的快速Boyer-Moore算法   总被引:5,自引:0,他引:5  
在对经典的Boyer-Moore和Quick Search串匹配算法进行分析的基础上,提出了一种更加快速的串匹配算法Quick Boyer-Moore(QBM)。QBM算法利用当前尝试中的已匹配子串、匹配失败字符信息以及与当前窗口下一个字符的位置信息,以在每一次跳跃中获得更大的跳跃距离,从而使算法具有更高的效率。在真实语料上的实验结果表明,QBM算法的效率较显著地高于原始的BM算法及其改进算法Impmved Boyer-Moore(IBM)。  相似文献   

9.
为了弥补多字符串模式匹配效率低下的缺陷,给出了一种基于双哈希表的多模式匹配算法。这个算法通过两个相关联的哈希表对模式串进行存储,同时采用一个转移表将发生失配时的跳跃距离存储。处于匹配阶段时:如果模式串无公共前缀,那么仅仅于第一个哈希表中进行查找;如果模式串有公共前缀,那么就在两个哈希表中顺序查找。经分析发现,此算法在最短模式串长度很长的环境中尤为适用,相对于经典算法,其时间复杂度较低,且其尝试次数也比较少。最后经实验可以证明,该算法具备较好的时空性能。  相似文献   

10.
针对现存多模匹配算法WM存在的三个缺点:每次参与匹配的模式串数量大、字符比较次数多、失配时文本串匹配窗口向右移动距离过小,提出一种改进WM算法——NEW_WM.采用后缀表和前缀表进行二次地址过滤,对前缀表采用平衡二叉树存储,减少每次需匹配的模式串数量;采用字频匹配快速找到失配字符,减少每次匹配时的比较次数;在失配时匹配窗口采用BMH和BMHS算法的跳跃距离的较大者右移.实验测试结果表明:在相同的条件下,相对于WM和DHSWM算法,NEW_WM算法在匹配性能方面有一定幅度的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号