首页 | 本学科首页   官方微博 | 高级检索  
     

基于DOM和元数据的Web信息提取
引用本文:刘政怡.基于DOM和元数据的Web信息提取[J].计算机与现代化,2003(10):81-82,94.
作者姓名:刘政怡
作者单位:安徽大学计算机科学与信息工程学院,安徽,合肥,230039
摘    要:以W3C的文档对象模型DOM和元数据为基础,把要提取的信息以DOM层次结构中的路径表达式来表示,通过归纳学习来获得所需信息的路径表达式,从而获得提取信息;元数据在信息提取过程中起到关键作用,它以XML的DTD表示,可以由信息服务商提供,也可以由开发人员给出,适应了信息源不断变化的特点。

关 键 词:互联网  Web  信息提取  DOM  元数据  归纳学习  文档对象模型
文章编号:1006-2475(2003)10-0081-02

DOM-based and Metadata-based Information Extraction for Web Sources
Abstract:
Keywords:wrapper  DOM  metadata  information extraction  inductive learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号