首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于人工策略的WEB信息精确提取系统
引用本文:刘玲.一种基于人工策略的WEB信息精确提取系统[J].四川建材学院学报,2009(2):49-52.
作者姓名:刘玲
作者单位:西南科技大学网络信息中心,四川绵阳621010
基金项目:国家863计划项目(2003AA116060).
摘    要:如何从海量的WEB信息中提取感兴趣的内容,传统的基于关键字检索的信息提取方法,适用于较为复杂的信息环境。针对特定信息的提取,提出了一种利用DOM树及HTML标签实现大量的特定格式化信息的精确提取方法。实验结果表明,在提取特定WEB信息的应用中达到100%的精确提取率。

关 键 词:信息提取  人工策略  DOM

An Artifical Method-based System of Web Information Exact Extraction
Authors:LIU Ling
Affiliation:LIU Ling( Center of Network Information, Southwest University of Science and Technology, Mianyang 621010, Sichuan, China)
Abstract:With the development of Internet, it will be a new hotspot how to extract the information of our need from web. The traditional methods based on key words are applied to the fields on complex information. This paper puts forward an artifical method-based system by using DOM and HTML. The results show that the accuracy is 100 percent when extracting specifically information.
Keywords:Information extraction  Artifical method  DOM
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号