归纳学习XPATH Web信息提取规则 Inductively Learn XPATH Web Information Extraction Rules期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

归纳学习XPATH Web信息提取规则

引用本文：	郭太飞　何洁月. 归纳学习XPATH Web信息提取规则[J]. 微机发展, 2007, 17(3): 98-101

作者姓名：	郭太飞　何洁月

作者单位：	东南大学计算机科学与工程学院江苏南京210096

基金项目：	江苏省高技术研究计划(G2004034)

摘要：	XPATH在Web信息提取中起重要作用,但是这些XPATH规则通常要人工生成。文中讨论了在XPATH与基于文本上下文规则的信息提取方法结合的系统中如何归纳学习XPATH规则。生成的XPATH规则结构简单,可以为基于文本上下文的信息提取系统提供较为准确的信息定位。
关键词：	信息提取系统 XPATH 归纳
文章编号：	1673-629X(2007)03-0098-04
修稿时间：	2006-05-28
Inductively Learn XPATH Web Information Extraction Rules

GUO Tai-fei,HE Jie-yue. Inductively Learn XPATH Web Information Extraction Rules[J]. Microcomputer Development, 2007, 17(3): 98-101

Authors:	GUO Tai-fei HE Jie-yue

Abstract:	XPATH plays an important role in Web information extraction,but these XPATH rules usually generated by hand.Discusses about how to inductively learn XPATH rules used in an XPATH and text-context-based rules combined information extraction system.The generated rules have simple structure,and they can support as an accurate locator for text-context-based information extraction system.

Keywords:	information extraction systems XPATH induction
本文献已被 CNKI 等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏