首页 | 本学科首页   官方微博 | 高级检索  
     

一种时间复杂度最优的精确串匹配算法
引用本文:贺龙涛,方滨兴,余翔湛.一种时间复杂度最优的精确串匹配算法[J].软件学报,2005,16(5):676-683.
作者姓名:贺龙涛  方滨兴  余翔湛
作者单位:哈尔滨工业大学,计算机网络与信息安全技术研究中心,黑龙江,哈尔滨,150001
基金项目:Supported bvthe National High-Tech Research and Development Plan ofChina under Grant No.2001AAl47010B(国家高技术研究发展计划(863));the Defense Pre-Research Project of the‘Ninth Five-Year-Plan'of China under Grant No.41315.7.3(国家"九五"国防预研基金)
摘    要:现有的串匹配算法通常以模式长度作为滑动窗口大小.在窗口移动后,往往会丢弃掉一些已扫描正文的信息.提出了LDM(linear DAWG matching)串匹配算法,该算法将正文分为n/m]个相互重叠、大小为2m-1的扫描窗口.在每个扫描窗口内,算法批量地尝试m个可能位置,首先使用反向后缀自动机从窗口中间位置向前扫描模式前缀;若成功,则再使用正向有限状态自动机从中间位置向后扫描剩余的模式后缀.分析证明,LDM算法的最差、最好、平均时间复杂度分别达到了理论最好结果:O(n),O(n/m),O(n(1ogσm)/m).实际性能测试也验证了平均时间复杂度最优这一理论结果.而且,对于在较大字母表下查找短模式的情况,LDM算法速度在被测试算法中最快.总之,LDM算法不但适合进行离线模式匹配,而且还特别适合需要进行在线高速匹配的应用.

关 键 词:后缀自动机  有限状态自动机  LDM算法  串匹配  复杂度分析
文章编号:1000-9825/2005/16(05)0676
收稿时间:2003/9/22 0:00:00
修稿时间:2003年9月22日

A Time Optimal Exact String Matching Algorithm
HE Long-Tao,FANG Bin-Xing and YU Xiang-Zhan.A Time Optimal Exact String Matching Algorithm[J].Journal of Software,2005,16(5):676-683.
Authors:HE Long-Tao  FANG Bin-Xing and YU Xiang-Zhan
Abstract:
Keywords:suffix automaton  finite automaton  LDM (linear DAWG matching) algorithm  string matching  complexity analysis
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号