期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

关超蒋建中郭军利《计算机工程》2010,36(1):208-210

在基于有限自动机的多模式匹配算法DFSA的基础上,结合改进的BM单模式匹配算法的优点,提出一种快速的多模式字符串匹配算法。在一般情况下,该算法不需要匹配目标文本串的每个字符,能充分利用匹配过程中本次匹配不成功的信息和已成功的信息,跳过尽可能多的字符。实验表明,模式串较短时,该算法需要的时间约为DFSA的1/2,模式串较长时,所需时间约为DFSA算法的1/3。相似文献

2.

一种时间复杂度最优的精确串匹配算法 总被引：14，自引：2，他引：12

下载免费PDF全文

贺龙涛方滨兴余翔湛《软件学报》2005,16(5):676-683

现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为[n/m]个相互重叠、大小为2m-1的扫描窗口.在每个扫描窗口内,算法批量地尝试m个可能位置,首先使用反向后缀自动机从窗口中间位置向前扫描模式前缀;若成功,则再使用正向有限状态自动机从中间位置向后扫描剩余的模式后缀.分析证明,LDM算法的最差、最好、平均时间复杂度分别达到了理论最好结果:O(n),O(n/m),O(n(1og_σm)/m).实际性能测试也验证了平均时间复杂度最优这一理论结果.而且,对于在较大字母表下查找短模式的情况,LDM算法速度在被测试算法中最快.总之,LDM算法不但适合进行离线模式匹配,而且还特别适合需要进行在线高速匹配的应用. 相似文献

3.

一种应用于现代网络搜索引擎的快速串匹配算法

吴楠朱怀宏夏黎春《计算机与现代化》2003,(11):7-8,11

提出了一种基于确定有穷自动机的快速多模式串匹配算法,在匹配过程中能尽可能多地跳过待查文本串字符。算法的特性为现代网络搜索引擎的复合条件查询提供了有力的软件支撑。实验表明可有效地改善网络搜索引擎的性能。相似文献

4.

串匹配算法中的自动机紧缩存储技术 总被引：1，自引：1，他引：0

杨毅夫刘燕兵刘萍郭莉《计算机工程》2009,35(21):39-41

自动机是串匹配算法中常用的数据结构,对自动机实现紧缩存储可以节省算法空间。总结常用自动机紧缩存储方法,分析其原理、时间效率、空间效率和优缺点,给出各种方法与数据稀疏性之间的关系。运用紧缩存储方法实现基本AC算法,对随机数据和真实数据的实验结果证明该算法有效。相似文献

5.

串匹配的一种算法

周培德《计算机研究与发展》1990,27(2):35-37,34

相似文献

6.

基于模板有限自动机的正则表达式匹配算法

邵翔宇刘勤让孙淼《计算机应用研究》2016,33(7)

采用规则分组的办法解决DFA状态爆炸问题,随着规则数目的增加,空间压缩效率大大降低。针对此问题,提出了模板有限自动机分组算法,基于规则模板对规则集进行分组,各分组分别构建匹配引擎。同时,根据实际规则数目和系统结构对规则子集的数目改变,达到更好的匹配效率。理论分析和实验表明,与传统分组算法相比,在存储空间压缩相当情况下,分组数目大大减少;与其他典型的DFA改进算法相比,预处理时间和存储空间有数量级别的缩减,且匹配速率没有明显降低。相似文献

7.

一种串匹配的快速Boyer-Moore算法* 总被引：5，自引：0，他引：5

李雪梅代六玲童新海李莉《计算机应用研究》2005,22(9):49-51

在对经典的Boyer-Moore和Quick Search串匹配算法进行分析的基础上,提出了一种更加快速的串匹配算法Quick Boyer-Moore（QBM）。QBM算法利用当前尝试中的已匹配子串、匹配失败字符信息以及与当前窗口下一个字符的位置信息,以在每一次跳跃中获得更大的跳跃距离,从而使算法具有更高的效率。在真实语料上的实验结果表明,QBM算法的效率较显著地高于原始的BM算法及其改进算法Impmved Boyer-Moore（IBM）。相似文献

8.

巨型多不确定串匹配完全自动机及其快速生成算法

胡玥高庆狮郭莉王培凤《中国科学:信息科学》2011,(5)

在串匹配搜索中,字符串常常采用U-不确定串、V-不确定串及其结合的U-V-不确定串.如何识别巨量U-不确定字符串、V-不确定字符串和U-V-不确定字符串,以及两个和两个以上U-V-不确定字符串的交错情况的串匹配,是没有遗漏地检测有害信息的关键问题.本文提出一个快速检测巨量U-不确定字符串、巨量V-不确定字符串和巨量U-V-不确定字符串的多串匹配完全自动机及其快速生成方法,包括两个和两个以上不确定字符串相互交错的情况;并且给出V-不确定字符串的完全自动机的最大并行台数,指出通常正则表达式匹配可能出现相似连接和交错情况的两种遗漏,指出如果没有从整体的角度对U-不确定串中的字符子串集进行两两不相交化及无同源后续奇点化的处理,结果就可能出现错误或者增加状态数目. 相似文献

9.

对QS串匹配算法的一种改进

李雪梅代六玲童新海王雄《计算机应用与软件》2006,23(3):108-109,130

本文提出一种改进的QS算法IQS。基于CPU进行一次字节长度的字符比较和进行一次机器字长长度的整数比较所花费的时间完全相同的事实,以及QS算法对当前尝试中比较顺序和匹配失败位置不关心的特点,IQS将字符比较映射到整数域进行。由于比较次数被成倍减少,算法的平均复杂度被降低,效率相应得到提高。在真实语料上的实验结果表明,IQS算法的匹配速度明显高于QS算法。相似文献

10.

PARA-AC：一种基于AC自动机的高性能匹配算法

熊仁都;杨嘉佳;朱广宇;唐球;隋然《电子技术应用》2020,(11):87-90+95

原始AC自动机由于匹配性能低,无法满足当前大数据环境下大规模特征串实时匹配的应用需求。针对这一问题,提出一种基于多线程的多模式串匹配加速算法,称之为PARA-AC(Parallel Aho-Corasick automaton)。该算法将待匹配字符串切割成若干字符子串以及若干切割点边界字符集,并将字符子串、切割点边界字符集输入至线程池中进行匹配,从而实现字符串的并行化加速处理。实验结果表明,与原始AC自动机匹配算法相比,PARA-AC算法显著提高了匹配速度,约为原始AC的13.91倍。相似文献

11.

一种快速的字符串匹配算法 总被引：8，自引：0，他引：8

钱屹侯义斌《小型微型计算机系统》2004,25(3):410-413

字符串匹配技术在许多领域里广泛应用，本文在分析了BF、BM算法以及一些重要的改进算法的基础上，提出了一种新的改进算法——BMH2C，该算法利用两个字符计算右移量并保存在二维数组里，使右移量增大，比较次数减少，有效地提高了匹配速度．最后本文还给出了几种匹配算法的测试结果。相似文献

12.

一种高效海量字符串集合的模式匹配算法

张建勋吴建国《计算机工程与应用》2004,40(13):93-96

提出一种高效海量字符串集合的模式匹配算法。给出了字符串集合模式匹配的定义,模式的预处理,字符串集合的存储结构和匹配算法,并分析了算法的复杂性和正确性。该文算法具有很好的时间复杂性和空间复杂性,因此具有很好的应用前景。相似文献

13.

基于像素字符串比较的图像快速匹配算法

贺川斌周明全王长缨《微机发展》2005,15(1):17-19,50

在分析传统的模板匹配算法的基础上提出了一种新的基于字符串匹配的快速匹配算法。算法的思路是在模板图像上任意确定一列像素，并将这一列像素的灰度值看成是一个字符串，以此对原图像的每一列进行字符串匹配。如果在原图像上的某一列上找到了完全匹配的串，或者找到最大匹配的串，就找到了所要匹配的模板在图像中的可能位置。然后在所有找到的位置上再做进一步的字符串匹配。如此继续就可以确定模板图像在待匹配图像上的位置。算法在统计意义上保证了匹配效果，且提高了匹配速度。实验结果表明该算法是一种有效的图像匹配算法。相似文献

14.

基于像素字符串比较的图像快速匹配算法

贺川斌周明全王长缨《计算机技术与发展》2005,15(1)

在分析传统的模板匹配算法的基础上提出了一种新的基于字符串匹配的快速匹配算法.算法的思路是在模板图像上任意确定一列像素,并将这一列像素的灰度值看成是一个字符串,以此对原图像的每一列进行字符串匹配.如果在原图像上的某一列上找到了完全匹配的串,或者找到最大匹配的串,就找到了所要匹配的模板在图像中的可能位置.然后在所有找到的位置上再做进一步的字符串匹配.如此继续就可以确定模板图像在待匹配图像上的位置.算法在统计意义上保证了匹配效果,且提高了匹配速度.实验结果表明该算法是一种有效的图像匹配算法. 相似文献

15.

入侵检测中一种新的快速字符串匹配算法 总被引：2，自引：0，他引：2

宋华戴一奇《计算机工程与应用》2003,39(32):48-51,89

基于字符串匹配的检测方法是入侵检测系统中一类很重要的分析方法。文章首先分析了现有的几种准确字符串匹配算法,然后提出了一种新的多模式字符串匹配算法,并且分析了这些算法的复杂性。最后,文章用具体的实验数据来验证这些算法的性能。通过实验可以看出,新算法使得检测速度大大提高,签名容量大大增加。相似文献

16.

一种用于内容过滤和检测的快速多关键词识别算法 总被引：13，自引：0，他引：13

宋华戴一奇《计算机研究与发展》2004,41(6):940-945

基于字符串匹配的检测方法是内容过滤和检测系统中一类很重要的分析方法,首先分析了现有的几种快速字符串匹配算法,然后提出了一种新的多模式字符串匹配算法,并简单分析了算法的复杂性,算法在设计的过程中吸取了BM算法中跳跃的特性,采用了后缀树算法得到了最大跳跃值,采用AC算法的匹配自动机原理从而避免对搜索树内每一个字符的匹配,最后,通过具体的实验数据验证了这些算法的性能,通过实验可以看出,新算法使得检测速度有很大提高,并有效屏蔽了关键词数量的增加对检测速度的影响。相似文献

17.

邻间关系匹配算法研究

周大庆蔺娟茹《计算机技术与发展》2006,16(11):117-118

对于26个字母的全排，它们的邻间关系是唯一的。文中根据这个特性，针对子串长度较长的（大于26）字符串匹配问题，提出了一种基于邻间关系的匹配算法。该算法把字符串的邻间关系转化为十进制的数值，并利用这一数值实现字符串的快速匹配。该算法时间复杂度为O（m-n），且算法简便，容易实现。相似文献

18.

A New String Matching Algorithm

《国际计算机数学杂志》2012,89(7):825-834

In this paper a new exact string-matching algorithm with sub-linear average case complexity has been presented. Unlike other sub-linear string-matching algorithms it never performs more than n text character comparisons while working on a text of length n . It requires only O ( m +σ) extra pre-processing time and space, where m is the length of the pattern and σ is the size of the alphabet. 相似文献

19.

一种基于Harr小波的快速模板匹配算法

陈景航杨宜民《计算机工程》2005,31(22):167-168,171

针对传统模板匹配算法的缺点,提出了一种基于Harr小波和SSDA的模板匹配算法,对图像进行由粗到细的匹配。实验结果表明：该算法流程简单,实时性好,匹配精度高。在不失匹配精度的条件下,克服了运算量大的缺点,从而满足图像匹配系统的实时性要求。相似文献

20.

基于匹配区域特征的相似字符串匹配过滤算法孙德才 总被引：1，自引：0，他引：1

孙德才孙星明张伟刘玉玲《计算机研究与发展》2010,47(4)

相似字符串匹配过滤算法因其适合大库查找而被广泛应用,为通过提高过滤算法的过滤效率加快匹配速度,提出一种基于匹配区域特征的过滤算法.该算法将模式串和文本串分割成固定长度为kq+1的逻辑块,并从各块中提取了2个新的匹配区域特征:q-gram命中的均匀性和q-gram有效命中的区域性.新算法利用这些新特征优化了传统过滤标准,提高了算法的过滤效率;并改进了QUASAR中基于分块策略的过滤区确定方案.实验结果表明,新算法与改进前相比有效地加快了匹配速度,尤其在误差率较小时改进效果更佳. 相似文献