首页 | 本学科首页   官方微博 | 高级检索  
     

基于XPath的Web信息抽取的设计与实现
引用本文:杨文柱,徐林昊,陈少飞,郝亚南,李天柱.基于XPath的Web信息抽取的设计与实现[J].计算机工程,2003,29(16):82-83,113.
作者姓名:杨文柱  徐林昊  陈少飞  郝亚南  李天柱
作者单位:河北大学数学与计算机学院,保定,071002
摘    要:提出了一种基于XPath的Web信息抽取方法,鉴于目前还没有免费的商用XPath引擎可用,于是利用DOM定制了一个XPath引擎,实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术,该方法可用于Web查询和包装器的构造,也可用于格式转换。

关 键 词:XPath  Web信息抽取  文档对象模型
文章编号:1000-3428(2003)16-0082-02

Design and Implementation of XPath-based Web Information Extraction
YANG Wenzhu,XU Linhao,CHEN Shaofei,HAO Yanan,LI Tianzhu.Design and Implementation of XPath-based Web Information Extraction[J].Computer Engineering,2003,29(16):82-83,113.
Authors:YANG Wenzhu  XU Linhao  CHEN Shaofei  HAO Yanan  LI Tianzhu
Abstract:This paper proposes a prototype system that implements XPath-based Web information extraction. Because there have not any commercial XPath available, it customizes an XPath engine to implement Web information extraction. This paper mainly emphasizes on the principle and technologies of prototype system and the method can be applied to Web query, wrappers implementing and format transformation.
Keywords:XPath  Web information extraction  DOM  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号