基于HTML和XML的信息提取方法研究 The Study of Information Retrieval Methods Based on HTML and XML期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于HTML和XML的信息提取方法研究

引用本文：	陈红叶. 基于HTML和XML的信息提取方法研究[J]. 计算机技术与发展, 2003, 13(Z2)

作者姓名：	陈红叶

作者单位：	安徽农业大学,信息与计算机学院,安徽,合肥,230036

摘要：	Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一.主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础.
关键词：	Wrapper程序句法标记树过滤算法超文本标记语言可扩展标识语言
The Study of Information Retrieval Methods Based on HTML and XML

Abstract:

Keywords:
本文献已被万方数据等数据库收录！