首页 | 本学科首页   官方微博 | 高级检索  
     

基于层次树模型的Deep Web数据提取方法
引用本文:田建伟,李石君.基于层次树模型的Deep Web数据提取方法[J].计算机研究与发展,2011,48(1).
作者姓名:田建伟  李石君
作者单位:1. 软件工程国家重点实验室(武汉大学),武汉,430079
2. 武汉大学计算机学院,武汉,430079
摘    要:网络在成为信息查询和发布平台的同时,海量的信息隐藏在查询受限的Web数据库中,使得人们无法有效地获取这些高质量的数据记录.传统的Deep Web搜索研究主要集中在通过关键字接口获取Web数据库内容.但是,由于Deep Web具有多属性和top-k的特点,基于关键字的方法具有固有的缺点,这就为Deep Web查询和检索带来了挑战.为了解决这个问题,提出了一种基于层次树的Deep Web数据获取方法,该方法可以无重复和完整地提取Web数据库中的数据记录.该方法首先把Web数据库模型化为一棵层次树,Deep Web数据获取问题就转化为树的遍历问题.其次,对树中的属性排序,缩小遍历空间;同时,利用基于属性值相关度的启发规则指导遍历过程提高遍历效率.最后,在本地模拟数据库和真实Web数据库上的大量实验证明,这种方法可以达到很好的覆盖度和较高的提取效率.

关 键 词:隐藏数据库  数据提取  多属性值接口  top-k元组  互信息

Retrieving Deep Web Data Based on Hierarchy Tree Model
Tian Jianwei,Li Shijun.Retrieving Deep Web Data Based on Hierarchy Tree Model[J].Journal of Computer Research and Development,2011,48(1).
Authors:Tian Jianwei  Li Shijun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号