基于XML的Web数据半自动采集 Web Data Sime-automatic Extraction Based on XML期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于XML的Web数据半自动采集

引用本文：	蒋宏潮,王大亮,班晓娟,阮进喜.基于XML的Web数据半自动采集[J].计算机工程,2009,35(21):51-53.

作者姓名：	蒋宏潮王大亮班晓娟阮进喜

作者单位：	北京科技大学信息工程学院,北京,100083

基金项目：	国家"863"计划基金资助顶目

摘要：	如何在信息量巨大的互联网上准确获取并长期跟踪用户关注的内容，是数据采集和挖掘的重要方面。探讨Web数据采集理论及其应用技术，给出一个半自动采集模型，设计基于旅游业数据的采集系统，验证数据半自动采集的可行性。
关键词：	数据采集信息采集半结构化数据
修稿时间：
Web Data Sime-automatic Extraction Based on XML

JIANG Hong-chao,WANG Da-liang,BAN Xiao-juan,RUAN Jin-xi.Web Data Sime-automatic Extraction Based on XML[J].Computer Engineering,2009,35(21):51-53.

Authors:	JIANG Hong-chao WANG Da-liang BAN Xiao-juan RUAN Jin-xi

Affiliation:	(School of Information Engineering, University of Science and Technology Beijing, Beijing 100083)

Abstract:	It is an important aspect of data extraction and mining that how to exactly gain and chronically trace the content regarded by users on Internet with huge information. This paper discusses Web data extraction theories and its application technologies, gives a sime-automatic extraction model, and designs a extraction system based on tourism industry data to prove the feasibility data sime-automatic extraction.

Keywords:	data extraction information extraction semi-structured data
本文献已被维普万方数据等数据库收录！
	点击此处可从《计算机工程》浏览原始摘要信息
	点击此处可从《计算机工程》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏