首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
正则表达式是一种源于Unix的强大的数据检索技术,它是由元字符与规则字符组成,允许用户对搜索条件有更灵活的控制,而且对于像电话号码、Email地址、文件名等规范格式也非常有用。正则表达式是定义复杂查询的一个强有力的工具,它定义了一个字符串的规则,使用了某些特殊的语法结构,能匹配更多的字符串。例如,正则表达式hellol word既能匹配字符串“hello”也能匹配字符串“word”。  相似文献   

2.
正则表达式的研究及在Web中的应用   总被引:1,自引:0,他引:1  
唐惠丽  郑小妹 《微机发展》2013,(2):82-84,88
文中利用正则表达式能够完成对字符串的匹配,替换的功能,以抽取HTML文档中的信息为例,介绍了正则表达式的理论和在Web中的不同使用方法。以达到从大量数据中挖掘出某些特定信息的目的。其原因是正则表达式是代表具有特殊意义字符的字符串,它能实现将某个字符模式与所预先定义的字符串模式进行匹配,从而抽取出所需的字符串。所以正则表达式使字符串的模式匹配变得更加容易。对于处理字符串的应用程序而言,它起着很重要的作用,应用十分广泛,是一个不可缺少的工具。  相似文献   

3.
针对确定有限自动机(DFA)的正则表达式匹配技术存在状态膨胀和一次状态转移只能处理单个字符的问题,提出了一种基于布鲁姆过滤器的正则表达式匹配算法。该算法将正则表达式中的每个确定字符串组成DFA的一个状态,添加比特向量完成匹配过程,并且在一次状态转移中根据确定字符串的匹配结果达到处理多个字符的目的。实验分析表明该算法有效降低了DFA状态的膨胀,提高了匹配速率。  相似文献   

4.
该文简略地介绍了正则表达式以及DB2中可用的字符串比较和匹配功能。还描述了为什么正则表达式的强大功能是如此有用。  相似文献   

5.
该文简略地介绍了正则表达式以及DB2中哥用的字符串比较和匹配功能。还描述了为什么正则表达式的强大功能是如此有用。  相似文献   

6.
正则表达式是对一类字符串共性描述的规则,提供了一种从字符集合中搜寻特定字符串的机制。信息抽取的主要功能是从文本中抽取出特定的事实信息(factual information)。该文利用正则表示式快速匹配文本的特点,以抽取电子文档的主要信息为例,介绍了正则表达式理论以及在信息抽取中的应用。  相似文献   

7.
深度包检测采用简单的字符串匹配技术将报文内容与一组固定字符串进行匹配,基于正则表达式匹配算法能提供更强的表达能力和灵活性,而复杂的正则表达式结构可能引起DFA的状态数膨胀,导致存储代价巨大;DFA拆分算法将DFA转换表拆分为三个表:间接索引表,转换输出表,直接转换表,实验结果表明DFA所占空间大大减小,实现了DFA的压缩存储。  相似文献   

8.
随着云计算的发展,越来越多的敏感数据被存储在云服务器上。为了保护隐私数据,通常对隐私数据进行加密。由于数据加密,很多对明文字符串的操作方案变得不可用,尤其是在密文状态下,如何使用正则表达式进行字符串的匹配,没有一种切实有效的方案。对在密文状态下正则表达式的使用进行研究,提出一种支持大部分常用的正则表达式规则的加密方案SCA(Searchable Crypt Algorithm)。SCA支持的正则表达式规则有ab*、bc?、a+、ab{m,n}等常用规则。  相似文献   

9.
正则表达式(Regular Expression,RE)因其强大的表达能力和简单性正取代精确字符串(explicitstring)成为描述模式(pattern)的首选。在网络应用中,基于DFA(确定有限自动机)的正则表达式匹配技术通常用于网络流量实时处理、病毒检测等系统中。随着正则表达式的数量不断增加,DFA的存储空间急剧膨胀导致Cache的命中率大大降低,最终影响匹配的性能。提出了一种高效的正则表达式分组算法,通过合理地将正则表达式分组来大大降低DFA所需的存储空间。还尝试提出了评价正则表达式分组算法的一些指标。  相似文献   

10.
在串匹配搜索中,字符串常常采用U-不确定串、V-不确定串及其结合的U-V-不确定串.如何识别巨量U-不确定字符串、V-不确定字符串和U-V-不确定字符串,以及两个和两个以上U-V-不确定字符串的交错情况的串匹配,是没有遗漏地检测有害信息的关键问题.本文提出一个快速检测巨量U-不确定字符串、巨量V-不确定字符串和巨量U-V-不确定字符串的多串匹配完全自动机及其快速生成方法,包括两个和两个以上不确定字符串相互交错的情况;并且给出V-不确定字符串的完全自动机的最大并行台数,指出通常正则表达式匹配可能出现相似连接和交错情况的两种遗漏,指出如果没有从整体的角度对U-不确定串中的字符子串集进行两两不相交化及无同源后续奇点化的处理,结果就可能出现错误或者增加状态数目.  相似文献   

11.
为了提高正则表达式在文本集合上的匹配效率,提出一种基于广义后缀树与过滤因子相结合的正则表达式匹配技术.根据给定的文本集合构建广义后缀树,通过在广义后缀树上定位过滤因子得到有效的候选匹配集合,利用过滤因子的序列信息进一步过滤候选集合,进而对候选集合中的字符串进行验证,得到匹配结果.通过在真实的数据集上进行实验,证明了该算...  相似文献   

12.
在很多工程项目中,数据库的数据处理通常都是使用标准的SQL语句完成的。但是标准的SQL语句在复杂的数据处理中却存在着诸多不足。正则表达式是一种非常重要和有效的字符串匹配模式,将其应用于SQL语句中,会具有强大的数据处理功能。介绍一个学员信息管理系统中使用的基于正则表达式的数据处理应用,不仅可以实现复杂的操作,而且降低了SQL语句的复杂程度,简化了对出错语句的修改工作。  相似文献   

13.
Ovation控制系统组态工程涉及大量文本处理工作,如整理IO清单、点数据库组态、流程图画面组态、控制逻辑图组态等。组态人员经常要从多个不同类型的文件中提取各类信息或批量替换其中的字符串。常规的查找/替换方法只能根据确切的字符串进行简单的查找和替换,这种方法效率低、灵活性差,不适合进行复杂文本处理。正则表达式基于模式匹配法则对文本进行智能查找和替换,功能非常强大。把正则表达式引入Ovation控制系统组态工程,通过多个实例说明了正则表达式的具体应用,开发了基于COM接口,集成了各种正则表达式匹配模式的Excel插件,解决了组态工作中的各种文本处理问题,大大提高了控制系统组态工作效率和质量。  相似文献   

14.
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的语法。本文通过与、或、非这三种逻辑运算来阐述正则表达式的正确使用方法。  相似文献   

15.
Web应用程序经常会对输入的字符串进行验证,传统的方法是使用Java Script进行一些常用的字符串的验证。本文是基于.NET平台的新功能,利用正则表达式,使用Regex类,对输入的字符串进行验证的方法。  相似文献   

16.
本文给出了在C#下利用正则表达式实现字符串搜索功能的方法,通过对.NET框架下的正则表达式的研究及实例分析,总结了正则表达式的元字符、规则、选项等.  相似文献   

17.
随着网络带宽的快速增长,正则表达式匹配逐渐成为网络数据处理系统的性能瓶颈。为了获得更高的匹配效率,基于FPGA的正则表达式匹配引擎成为近年来的研究热点之一,而将正则表达式高效的转换成硬件描述语言是其中的关键技术。首先分析了正则表达式转换为硬件电路的算法,然后在此算法基础上实现了一个编译器。最后在Modelsim平台上进行了仿真,仿真结果证明了编译器的正确性。  相似文献   

18.
正则表达式是一种用于字符串模式匹配和替换的强有力工具。介绍了在vc++中如何配置Boost.Regex,实现基于正则表达式网页信息抽取类CHtmlcodelE.从而完成了网页信息高效抽取。  相似文献   

19.
QC#中如何巧借正则表达式解析度分秒A前段时间,需要做一个小程序解析用户输入的度分秒字符串,并将其转换为度来显示和处理。开始,处理问题思路是:首先,字符串解析。按照度分秒标志对字符串进行分割,分割3次后。然后根据分割的字符串,再进行数字解析,得到实际的度分秒的值。最后对数字按照规则度分秒的计算规则,计算得到所需要的度。  相似文献   

20.
本文提出了一种用于对正则表达式的覆盖能力进行评价的算法.我们将一条正则表达式可覆盖的实例的数目定义为正则表达式的覆盖能力.算法首先将完整的正则表达式分成若干片断,然后分析每个片断可覆盖的字符串实例数目,最后根据乘法原理将各个片断可覆盖的实例数目相乘,即为当前正则表达式可覆盖的实例数目.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号