首页 | 本学科首页   官方微博 | 高级检索  
     

基于扩展标记图的Web信息抽取器
引用本文:王亮,朱征宇.基于扩展标记图的Web信息抽取器[J].计算机工程,2005,31(8):159-161,191.
作者姓名:王亮  朱征宇
作者单位:重庆大学计算机学院,重庆,400044;重庆大学计算机学院,重庆,400044
基金项目:重庆大学骨干教师资助计划项目(2003A33)
摘    要:介绍了一种新的Web信息抽取器,该抽取器基于扩展标记图模型,实观了数据和模式的分离,应用于Web检索系统中,能够有效地支持标记级实时信息检索、抽取和重组。还介绍了其在Web信息检索系统PowerSearcher中的实际应用。

关 键 词:Web信息抽取器  扩展标记图  半结构数据  Web检索
文章编号:1000-3428(2005)08-0159-03

Web Information Extractor Based on Extended Tag Graph
WANG Liang,ZHU Zhengyu.Web Information Extractor Based on Extended Tag Graph[J].Computer Engineering,2005,31(8):159-161,191.
Authors:WANG Liang  ZHU Zhengyu
Abstract:A new Web information extractor is discussed. It is based on extend tag graph (ETG), and has the ability to separate the data from the pattern data. This extractor is used in Web information retrieval, with supporting effective real-time information retrieval, extract and reform in tag level inside the Web page. Besides the design of the extractor, it also discusses its practice in experimental system.
Keywords:Web information extractor  Extend tag graph  Semi-structured data  Web retrieval
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号