基于XPath的Web信息抽取的设计与实现 Design and Implementation of XPath-based Web Information Extraction期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于XPath的Web信息抽取的设计与实现

引用本文：	杨文柱,徐林昊,陈少飞,郝亚南,李天柱.基于XPath的Web信息抽取的设计与实现[J].计算机工程,2003,29(16):82-83,113.

作者姓名：	杨文柱徐林昊陈少飞郝亚南李天柱

作者单位：	河北大学数学与计算机学院,保定,071002

摘要：	提出了一种基于XPath的Web信息抽取方法，鉴于目前还没有免费的商用XPath引擎可用，于是利用DOM定制了一个XPath引擎，实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术，该方法可用于Web查询和包装器的构造，也可用于格式转换。
关键词：	XPath Web信息抽取文档对象模型
文章编号：	1000-3428(2003)16-0082-02
Design and Implementation of XPath-based Web Information Extraction

YANG Wenzhu,XU Linhao,CHEN Shaofei,HAO Yanan,LI Tianzhu.Design and Implementation of XPath-based Web Information Extraction[J].Computer Engineering,2003,29(16):82-83,113.

Authors:	YANG Wenzhu XU Linhao CHEN Shaofei HAO Yanan LI Tianzhu

Abstract:	This paper proposes a prototype system that implements XPath-based Web information extraction. Because there have not any commercial XPath available, it customizes an XPath engine to implement Web information extraction. This paper mainly emphasizes on the principle and technologies of prototype system and the method can be applied to Web query, wrappers implementing and format transformation.

Keywords:	XPath Web information extraction DOM
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏