首页 | 本学科首页   官方微博 | 高级检索  
     

归纳学习XPATH Web信息提取规则
引用本文:郭太飞 何洁月. 归纳学习XPATH Web信息提取规则[J]. 微机发展, 2007, 17(3): 98-101
作者姓名:郭太飞 何洁月
作者单位:东南大学计算机科学与工程学院 江苏南京210096
基金项目:江苏省高技术研究计划(G2004034)
摘    要:XPATH在Web信息提取中起重要作用,但是这些XPATH规则通常要人工生成。文中讨论了在XPATH与基于文本上下文规则的信息提取方法结合的系统中如何归纳学习XPATH规则。生成的XPATH规则结构简单,可以为基于文本上下文的信息提取系统提供较为准确的信息定位。

关 键 词:信息提取系统  XPATH  归纳
文章编号:1673-629X(2007)03-0098-04
修稿时间:2006-05-28

Inductively Learn XPATH Web Information Extraction Rules
GUO Tai-fei,HE Jie-yue. Inductively Learn XPATH Web Information Extraction Rules[J]. Microcomputer Development, 2007, 17(3): 98-101
Authors:GUO Tai-fei  HE Jie-yue
Abstract:XPATH plays an important role in Web information extraction,but these XPATH rules usually generated by hand.Discusses about how to inductively learn XPATH rules used in an XPATH and text-context-based rules combined information extraction system.The generated rules have simple structure,and they can support as an accurate locator for text-context-based information extraction system.
Keywords:information extraction systems  XPATH  induction
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号