基于DOM和元数据的Web信息提取 |
| |
引用本文: | 刘政怡.基于DOM和元数据的Web信息提取[J].计算机与现代化,2003(10):81-82,94. |
| |
作者姓名: | 刘政怡 |
| |
作者单位: | 安徽大学计算机科学与信息工程学院,安徽,合肥,230039 |
| |
摘 要: | 以W3C的文档对象模型DOM和元数据为基础,把要提取的信息以DOM层次结构中的路径表达式来表示,通过归纳学习来获得所需信息的路径表达式,从而获得提取信息;元数据在信息提取过程中起到关键作用,它以XML的DTD表示,可以由信息服务商提供,也可以由开发人员给出,适应了信息源不断变化的特点。
|
关 键 词: | 互联网 Web 信息提取 DOM 元数据 归纳学习 文档对象模型 |
文章编号: | 1006-2475(2003)10-0081-02 |
DOM-based and Metadata-based Information Extraction for Web Sources |
| |
Abstract: | |
| |
Keywords: | wrapper DOM metadata information extraction inductive learning |
本文献已被 CNKI 维普 万方数据 等数据库收录! |