首页 | 本学科首页   官方微博 | 高级检索  
     

应用词法分析方法抽取Web查询接口模式
引用本文:王四维,申德荣,李英军,聂铁铮,寇月.应用词法分析方法抽取Web查询接口模式[J].计算机研究与发展,2010,47(Z1).
作者姓名:王四维  申德荣  李英军  聂铁铮  寇月
作者单位:东北大学信息科学与工程学院,沈阳,110004
基金项目:国家自然科学基金项目,国家"八六三"高技术研究发展计划基金项目 
摘    要:Deep Web中蕴含着大量高质量的数据,然而只有通过Web查询接口对Web数据库提交查询才能获取这些数据,因此,自动获取Web查询接口模式是实现Web数据库集成的关键.将Web查询接口模式的抽取过程看作一个词法分析的过程,通过构建EGLM-FA(元素分组及标签匹配有限状态自动机)来完成对Web查询接口模式的抽取.首先应用Html呈现引擎将Web查询接口所在页面进行解析,利用查询接口Form中的DOM节点及其坐标信息构建相应的NSS(节点空间结构),之后再将所有的NSS组成NSS列表,将NSS列表作为EGLM-FA的输入,进而抽取出Web查询接口的模式.

关 键 词:Web查询接口  模式抽取  词法分析

Using Lexical Analysis Approach to Extract Schemas of Web Query Interfaces
Wang Siwei,Shen Derong,Li Yingjun,Nie Tiezheng,Kou Yue.Using Lexical Analysis Approach to Extract Schemas of Web Query Interfaces[J].Journal of Computer Research and Development,2010,47(Z1).
Authors:Wang Siwei  Shen Derong  Li Yingjun  Nie Tiezheng  Kou Yue
Abstract:
Keywords:Deep Web
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号