首页 | 本学科首页   官方微博 | 高级检索  
     

基于Agent的Web页面结构化信息抽取
引用本文:岳国伟,梁永全.基于Agent的Web页面结构化信息抽取[J].计算机研究与发展,2007,44(Z2):344-349.
作者姓名:岳国伟  梁永全
作者单位:山东科技大学信息科学与工程学院,青岛,266510
摘    要:结合当前Web站点的数据特点,以信息项在页面中的出现位置为信息抽取的路径,利用PAT树技术,提出了一个多Agent协作的自动信息抽取模型.该模型能够自动分析样本页面数据特征,归纳学习整个站点的数据模式,生成抽取规则,指导以后的抽取动作.实验结果表明,该模型对Web页面的结构化信息抽取具有较高的效率.

关 键 词:智能体  PAT树  信息抽取  Web  Agent  结构化  信息抽取  Pages  Information  Extraction  效率  结果  实验  指导  抽取规则  数据模式  归纳学习  数据特征  样本  分析  抽取模型  自动  利用  路径  位置
修稿时间:2007年3月5日

Agent-Based Structured Information Extraction from Web Pages
Yue Guowei,Liang Yongquan.Agent-Based Structured Information Extraction from Web Pages[J].Journal of Computer Research and Development,2007,44(Z2):344-349.
Authors:Yue Guowei  Liang Yongquan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号