基于HTML和XML的信息提取方法研究 |
| |
引用本文: | 陈红叶. 基于HTML和XML的信息提取方法研究[J]. 计算机技术与发展, 2003, 13(Z2) |
| |
作者姓名: | 陈红叶 |
| |
作者单位: | 安徽农业大学,信息与计算机学院,安徽,合肥,230036 |
| |
摘 要: | Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一.主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础.
|
关 键 词: | Wrapper程序 句法标记树 过滤算法 超文本标记语言 可扩展标识语言 |
The Study of Information Retrieval Methods Based on HTML and XML |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|