首页 | 本学科首页   官方微博 | 高级检索  
     

使用ILP学习Web信息提取规则
引用本文:郭太飞,何洁月.使用ILP学习Web信息提取规则[J].计算机工程与设计,2007,28(16):4019-4021.
作者姓名:郭太飞  何洁月
作者单位:东南大学,计算机与科学学院,江苏,南京,210096
基金项目:江苏省高技术研究发展计划项目
摘    要:归纳逻辑编程(ILP)可以用于学习各种形式的逻辑规则,但在尝试用于学习Web页面的信息提取规则时存在格式不匹配问题.给出了系统结构的数据流图,重点分析了格式不匹配问题,提出了一种解决方案,主要包括规则的语法定义和动态生长方法.生成的规则结构清晰,可以用于从Web页面提取信息.

关 键 词:归纳逻辑编程  文本上下文规则  格式不匹配  动态生长  关系函数  测试函数  判别函数  使用  学习  提取信息  提取规则  rules  information  extraction  规则结构  生长方法  动态  方案  分析  重点  流图  数据  系统结构  匹配问题  格式  存在  逻辑规则  归纳逻辑编程
文章编号:1000-7024(2007)16-4019-03
修稿时间:2006-09-15

Using ILP to learn web information extraction rules
GUO Tai-fei,HE Jie-yue.Using ILP to learn web information extraction rules[J].Computer Engineering and Design,2007,28(16):4019-4021.
Authors:GUO Tai-fei  HE Jie-yue
Affiliation:College of Computer Science and Engineering, Southeast University, Nanjing 210096, China
Abstract:Inductive logic programming(ILP) can be used to learn kinds of rules,but format mismatching problems occur on trying learning information extraction rules for web pages.The system architecture's data flow is presented,format mismatching problems are focused on,and then a solution for the problems is given including the symantic definition and dynamic growing method of the rules.The generated rules have clear architectures,and can be used to extract information.
Keywords:inductive logic programming(ILP)  textual context based rule  format mismatching  dynamic growing  relation function  test function  discriminator function
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号