首页 | 本学科首页   官方微博 | 高级检索  
     

网络信息审计系统中的多模式相似匹配算法
引用本文:高鹏,张德运,孙钦东,翟亚辉,卢伍春.网络信息审计系统中的多模式相似匹配算法[J].软件学报,2004,15(7):1074-1080.
作者姓名:高鹏  张德运  孙钦东  翟亚辉  卢伍春
作者单位:西安交通大学,电子与信息工程学院,陕西,西安,710049
基金项目:Supported bythe National Security Fundfromthe Ministry of Information Industry of China under Grant No.2001-1-010(国家信息产业部计算机网络与信息安全基金)
摘    要:针对网络信息审计系统的需要,提出一种新颖的基于Episode距离的快速多模式相似串匹配算法.该算法把模式串集合转换为多个有限自动机,然后利用模式串集合建立一个状态驱动器.依次用待匹配串的字符驱动状态驱动器,由状态驱动器驱动各个有限自动机,实现了中英文混合的允许插入错误的相似多模式匹配.该算法不需要匹配每个字符,能充分利用匹配过程中本次匹配不成功的信息并结合改进的文本窗机制,跳过尽可能多的字符;能够控制每个模式串的允许错误上限;匹配速度与允许插入的错误字符教k无关.该算法在信息审计、数据库、信息检索等领域有

关 键 词:信息审计  允许错误的匹配  多模式相似匹配  有限自动机
文章编号:1000-9825/2004/15(07)1074
收稿时间:2003/5/21 0:00:00
修稿时间:2003年5月21日

A Multiple Approximate String Matching Algorithm of Network Information Audit System
GAO Peng,ZHANG De-Yun,SUN Qin-Dong,ZHAI Ya-Hui and LU Wu-Chun.A Multiple Approximate String Matching Algorithm of Network Information Audit System[J].Journal of Software,2004,15(7):1074-1080.
Authors:GAO Peng  ZHANG De-Yun  SUN Qin-Dong  ZHAI Ya-Hui and LU Wu-Chun
Abstract:This paper shows a simple, efficient, and practical algorithm for locating all occurrences of a finite number of a finite number of keywords in a char/Chinesw character string allowing k chars inserting errors.The algorithm consists of constructing muleiple finite state single-pattern matching machines form keywords and a state-driver appled to drive all finite state finite state single-pattern matching machines,and then using the state-driver to process the text string in a single pass.Speed of the matching is independentof the amount of the inserting errors.Generally,the text string in a not need to inspect every character of the string.They skip as many characters as possible by making full use of the information in matching failure and text window mechanism.This algorithm can be widely applied to network infomation auditing,database,information retrieval,and etc.
Keywords:information audit  matching allowing errors  multiple approximate string match  finite state machine
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号