首页 | 本学科首页   官方微博 | 高级检索  
     

基于XPath的新闻信息抽取系统设计与实现
引用本文:阮娟.基于XPath的新闻信息抽取系统设计与实现[J].电脑学习,2015(2).
作者姓名:阮娟
作者单位:台州职业技术学院 电气信息学院,浙江 台州,318000
摘    要:随着互联网技术的迅猛发展,因特网成为目前新闻信息最丰富最主要的来源。本文在分析新闻网页的基础上,分析了目前现有的信息抽取技术和XML技术,提出了一个基于XML技术的Web新闻抽取系统。本文主要是充分运用XML中的XPath技术在数据定位方面的优势,并提出一种基于DOM树的XPath生成算法,使用XSLT语言用于描述抽取规则,并使用路径表达式XPath定位待抽取的信息点。

关 键 词:数据挖掘  信息抽取  新闻抽取系统  XPath

Design and Implementation of News and Information Extraction System based on XPath
RUAN Juan.Design and Implementation of News and Information Extraction System based on XPath[J].Computer Study,2015(2).
Authors:RUAN Juan
Abstract:
Keywords:Data Mining  Information Extraction  News and Information Extraction System  XPath
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号