首页 | 本学科首页   官方微博 | 高级检索  
     

基于HTML和XML的信息提取方法研究
引用本文:陈红叶. 基于HTML和XML的信息提取方法研究[J]. 计算机技术与发展, 2003, 13(Z2)
作者姓名:陈红叶
作者单位:安徽农业大学,信息与计算机学院,安徽,合肥,230036
摘    要:Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一.主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础.

关 键 词:Wrapper程序  句法标记树  过滤算法  超文本标记语言  可扩展标识语言

The Study of Information Retrieval Methods Based on HTML and XML
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号