排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
2.
基于与或树的正则表达式有害二义性检查算法 总被引:1,自引:0,他引:1
在构造面向应用的正则表达式(RE)过程中,引入有益二义性可简化RE构造,而将有害二义性遗留在RE中会危害匹配结果的正确性.为区别对待这两种二义性,基于与或树提出一种检查和定位RE中有害二义性的算法,该算法可减轻RE调试的工作量.实验表明,该算法在时间性能、空间性能和实用性等方面优于现有基于自动机的二义性检查算法.基于此算法的可视化RE编辑调试环境已用于构建国内第一个整合的生物数据仓库. 相似文献
3.
邓绪斌 《计算机应用与软件》2007,24(12):65-67
数据抽取常用正则表达式(RE)来描述数据源.为实现可视化描述,需将RE转换成分析树.但现有基于改写的RE分析树构造方法会破坏数据对象的内在结构,不能用于数据抽取问题.提出了一种无改写的RE分析树构造算法.实验表明,该算法在时空间性能和实用性等方面优于现有RE分析树构造算法. 相似文献
4.
ReDE:一个基于正则表达式的生物数据抽取方法 总被引:4,自引:0,他引:4
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量.基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护.该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库. 相似文献
5.
介绍了VI—DE,数据抽取工具DE-Wrapper的可视化编辑调试环境。DE—Wrapper使用扩展正则表达式(ERE)描述数据源结构,根据陵ERE构造数据抽取树(DE-树),然后根据DE-树生成相应的关系数据库模式,最后抽取数据。VI-DE整合了DE-Wrapper的工作流程。该工具首先使用可视化界面支持ERE/DE-树可视化构建,然后自动检查该ERE/DE.树是否具有二义性,最后在样本数据七运行抽取算法并给出数据库结构和抽取结果,供用户进行评价,从而逐步引导用户设计出满足要求的ERE/DE-树。VI—DE已用于构建国内第1个整合的生物信息存线数据仓库系统。 相似文献
1