首页 | 官方网站   微博 | 高级检索  
     

识别和抽取Web列表中的关系信息
引用本文:吴扬扬,陈锻生.识别和抽取Web列表中的关系信息[J].计算机科学,2004,31(6):86-88.
作者姓名:吴扬扬  陈锻生
作者单位:1. 国立华侨大学计算机科学系,泉州,362011
2. 国立华侨大学计算机科学系,泉州,362011;中国科学技术大学电子工程与信息科学系,合肥,230027
基金项目:国家计委重点项目国务院侨办部门专项(ZX2000),福建省自然科学基金(A0210017)
摘    要:有大量的关系信息存在于各种各样的Web列表中,但使用目前的搜索引擎却难以找到它们。本文提出了一种基于语义和数据特征的方法,用于识别和抽取Web列表中的关系信息。我们首先建立一个模型,描述所要的关系信息,然后寻找Web上的列表并估计它们是否包含所要的关系信息,当估计值足够大时.则从中抽取所要的关系信息。

关 键 词:识别  抽取  Web列表  关系信息  语义  数据特征

Recognizing and Extracting Relations in Web Tables and Lists
WU Yang-Yang CHEN Duan-Sheng.Recognizing and Extracting Relations in Web Tables and Lists[J].Computer Science,2004,31(6):86-88.
Authors:WU Yang-Yang CHEN Duan-Sheng
Affiliation:WU Yang-Yang~1 CHEN Duan-Sheng~
Abstract:There is a lot of relation information in all kinds of tables and lists on the Web. But using search engines it is not easy to find them. In this paper, a method based on semantics and datum feature is proposed. It can be used to recognize and extract the desired relation information from tables and lists on the Web. We set up a model to describe the desired relation first, and then search the Web to find table and lists. For each found table or list, evaluate if it contains desired relation. If evaluation is big enough, our system will extract relation information from the table or list.
Keywords:Web table and list  Relation information  Recognition  Extracting  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号