首页 | 本学科首页   官方微博 | 高级检索  
     

基于XML的Web数据半自动采集
引用本文:蒋宏潮,王大亮,班晓娟,阮进喜.基于XML的Web数据半自动采集[J].计算机工程,2009,35(21):51-53.
作者姓名:蒋宏潮  王大亮  班晓娟  阮进喜
作者单位:北京科技大学信息工程学院,北京,100083
基金项目:国家"863"计划基金资助顶目 
摘    要:如何在信息量巨大的互联网上准确获取并长期跟踪用户关注的内容,是数据采集和挖掘的重要方面。探讨Web数据采集理论及其应用技术,给出一个半自动采集模型,设计基于旅游业数据的采集系统,验证数据半自动采集的可行性。

关 键 词:数据采集  信息采集  半结构化数据
修稿时间: 

Web Data Sime-automatic Extraction Based on XML
JIANG Hong-chao,WANG Da-liang,BAN Xiao-juan,RUAN Jin-xi.Web Data Sime-automatic Extraction Based on XML[J].Computer Engineering,2009,35(21):51-53.
Authors:JIANG Hong-chao  WANG Da-liang  BAN Xiao-juan  RUAN Jin-xi
Affiliation:(School of Information Engineering, University of Science and Technology Beijing, Beijing 100083)
Abstract:It is an important aspect of data extraction and mining that how to exactly gain and chronically trace the content regarded by users on Internet with huge information. This paper discusses Web data extraction theories and its application technologies, gives a sime-automatic extraction model, and designs a extraction system based on tourism industry data to prove the feasibility data sime-automatic extraction.
Keywords:data extraction  information extraction  semi-structured data
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号