首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
黄晓春  孟岩 《程序员》2007,(6):98-99
本文是作者2007-03期文章的继续,正则表达式首先是一个文本处理工具,它的作用正在超越这一范围。正如本文作者所言,由于它对结构的关注,它其实正在改变人们设计程序的思维方式。  相似文献   

2.
余晟 《程序员》2008,(3):95-98
环视结构(look-around) 分析日志(或普通数据文件),恐怕是大家在日常工作中经常遇到的问题,正则表达式应当是理所当然的选择,简单的正则表达式应用,大家应该都会,即使暂时不熟悉,查查资料也能解决。但是,有时候情况复杂,看起来正则表达式往往“束手无策”,其实事实并非如此。在这篇文章中,我们通过一个具体的例子,来讲解正则表达式的高级技巧。  相似文献   

3.
余晟 《Internet》2008,(9):97-100
这是作者上一篇随笔的继续,本文接着讨论了在使用正则表达式时,最常出现的问题。  相似文献   

4.
余晟 《Internet》2008,(3):95-98
环视结构(look-around) 分析日志(或普通数据文件),恐怕是大家在日常工作中经常遇到的问题,正则表达式应当是理所当然的选择,简单的正则表达式应用,大家应该都会,即使暂时不熟悉,查查资料也能解决。但是,有时候情况复杂,看起来正则表达式往往“束手无策”,其实事实并非如此。在这篇文章中,我们通过一个具体的例子,来讲解正则表达式的高级技巧。  相似文献   

5.
在很多工程项目中,数据库的数据处理通常都是使用标准的SQL语句完成的。但是标准的SQL语句在复杂的数据处理中却存在着诸多不足。正则表达式是一种非常重要和有效的字符串匹配模式,将其应用于SQL语句中,会具有强大的数据处理功能。介绍一个学员信息管理系统中使用的基于正则表达式的数据处理应用,不仅可以实现复杂的操作,而且降低了SQL语句的复杂程度,简化了对出错语句的修改工作。  相似文献   

6.
佘石泉  周肆清 《微机发展》2007,17(7):244-246
分析了编程题的自动阅卷的现状及存在的不足。为了让计算机能够更加合理和有效地进行编程题的阅卷,提出了一种用正则表达式来分析程序代码,模拟人工阅卷的方法。介绍了此方法的原理和主要功能,给出了方法实现的具体步骤,对方法的关键部分如Java处理正则表达式的各个类以及方法的具体实施等都进行了详细的解释并举例进行了说明。其核心思想是利用正则表达式来抽象标准答案,再利用正则表达式强大的文本匹配功能来进行程序代码的分析,把不变的文本转化为具有一般性的表达式,大幅度增加了匹配的灵活性,从而达到简化阅卷的目的。  相似文献   

7.
正则表达式在编程题自动阅卷中的应用   总被引:2,自引:0,他引:2  
分析了编程题的自动阅卷的现状及存在的不足。为了让计算机能够更加合理和有效地进行编程题的阅卷,提出了一种用正则表达式来分析程序代码,模拟人工阅卷的方法。介绍了此方法的原理和主要功能,给出了方法实现的具体步骤,对方法的关键部分如Java处理正则表达式的各个类以及方法的具体实施等都进行了详细的解释并举例进行了说明。其核心思想是利用正则表达式来抽象标准答案,再利用正则表达式强大的文本匹配功能来进行程序代码的分析,把不变的文本转化为具有一般性的表达式,大幅度增加了匹配的灵活性,从而达到简化阅卷的目的。  相似文献   

8.
Internet正在日益成为一个重要的信息来源,如何对Web数据进行检索和加工,使得用户能够更好地利用Internet上的数据资源己经成为了新的研究热点。文中论述了半自动化数据提取算法,其中使用了基于扩展正则表达式的信息槽提取算法和基于网页特性的事件分割算法。同时描述了利用这些算法的信息提取系统,并详细介绍了系统的体系结构和实现细节。该系统可以被用于真实的Web环境中以提高存储、利用信息的效率,在一定程度上解决在Internet上获取信息及利用信息的困难。  相似文献   

9.
唐壹勋 《福建电脑》2008,(3):117-118
本文首先简要介绍了网页清洗技术,然后指出了新闻网页的特征并做了结构分析,在此基础上使用了正则表达式来解析批量新闻网页中的HTML代码,并最终获得新闻文本内容。本文研究所获取的实验数据可以为WEB中新闻的信息检索和挖掘工作服务。  相似文献   

10.
正则表达式的Web数据提取研究   总被引:1,自引:0,他引:1  
Internet正在日益成为一个重要的信息来源,如何对Web数据进行检索和加工,使得用户能够更好地利用Intemet上的数据资源己经成为了新的研究热点。文中论述了半自动化数据提取算法,其中使用了基于扩展正则表达式的信息槽提取算法和基于网页特性的事件分割算法。同时描述了利用这些算法的信息提取系统,并详细介绍了系统的体系结构和实现细节。该系统可以被用于真实的Web环境中以提高存储、利用信息的效率,在一定程度上解决在Internet上获取信息及利用信息的困难。  相似文献   

11.
首先对正则表达式进行了整体描述,然后对客户端数据校验和服务器端数据校验的利弊进行了分析,最后给出了电子邮件地址的数据校验正则表达式,用于进行客户端的数据校验。  相似文献   

12.
13.
正则表达式与XML配置文件相结合的数据提取   总被引:1,自引:0,他引:1  
针对特定搜索引擎的实际需求,需要从网站中提取有效的数据作为它的数据源.本文通过对网页内部结构的分析,利用正则表达式与XML配置文件相结合的方法,建立了基于特定网页的框架和规则的数据内容提取方法,并加以实现.该方法成功运用到多个信息提取系统中,实现了高效、准确的数据提取.  相似文献   

14.
田兰  金石声  李波  卜英竹  李珏 《计算机科学》2013,40(Z11):432-435
随着气象综合观测网建设的不断推进,气象实时数据信息传输种类和数据量急剧增加。同时,气象实时数据信息的传输处理呈现某一特定时段需并行处理多类实时数据信息的特点。为实现气象数据信息高效、可靠、完整、及时的收集、存储和共享,采用XML标记语言对各类实时数据信息的报文内容进行标识和说明的方法,形成各数据业务类型定义,结合基于正则表达式的数据处理应用,使系统具备适应气象观测数据业务变化的能力。实现了对实时气象数据信息在省级中心的收集、处理、分发,改善了原有业务系统繁杂、功能单一、扩展性差、效率低等缺陷。  相似文献   

15.
正则表达式在电子政务客户端校验中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式匹配功能,可以用来校验各种类型数据。加入正则表达式校验层,扩充传统三层B/S架构至四层后,通过校验客户端输入数据,能够遏制某些客户端攻击,在一定程度上提高电子政务系统安全性、可靠性。在电子政务系统建设中应用该项技术,取得了优良的效果。  相似文献   

16.
贾震斌 《福建电脑》2011,27(10):11-12
篇章关系识别是计算机自然语言处理领域中近年来研究的一个难点,采用语料库结合机器学习分类是目前主要研究路径,将语料数据转换成适合篇章关系识别训练与测试数据过程通常比较繁琐,本文结合自己研究过程提出了语料数据预处理的方法,该方法在隐式篇章关系识别研究效率中取得了明显效果,为进一步研究提供了基础。  相似文献   

17.
正则表达式是数据验证技术中功能最为强大的输入控制技术。传统的基于NFA的正则表达式引擎的匹配速度低。通过正则表达式与自动机等价的原理,研究了通过最小化的确定的有限自动机(DFA)来等价实现.NET中正则表达式的数据验证的机制,以期提高正则表达式的匹配速度。  相似文献   

18.
数据抽取常用正则表达式(RE)来描述数据源.为实现可视化描述,需将RE转换成分析树.但现有基于改写的RE分析树构造方法会破坏数据对象的内在结构,不能用于数据抽取问题.提出了一种无改写的RE分析树构造算法.实验表明,该算法在时空间性能和实用性等方面优于现有RE分析树构造算法.  相似文献   

19.
在基于有限状态自动机的正则表达式匹配技术中,存储需求和匹配性能是一对相互制约的因素.统计分析发现,对于给定的自动机,状态的访问概率分布呈Zipf规律.为解决存储和性能的矛盾,设计并实现了基于Net Magic的两级存储的匹配引擎;根据状态的访问概率特性,将访问概率较高的状态配置在小容量的高速存储器中,访问概率较低的状态配置在大容量的低速存储器中,从而达到存储与性能的平衡.同时利用FPGA内部多RAM块特性,实例化多个匹配引擎,进一步使匹配速度线性提升.在资源充裕的条件下,理论上可达到65Gbps的吞吐量.实验表明单位存储代价大幅降低,但受限于Net Magic存储资源、频率及端口速率,实际性能为2.1Gbps.  相似文献   

20.
一般微处理器或单片机程序设计的工具是汇编语言,汇编语言要求编程者熟悉单片机的内部结构和指令系统,令初学者望而生畏。同时用汇编语言编写的程序直接反映单片机的执行过程,不易理解,即使是编程者自已编制的程序,过几天以后连编程者自己都可能读不懂了,有时候程序的注释甚至比原始程序还要长。鉴于此,在80年代后期,一些单片机生产厂家  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号