首页 | 本学科首页   官方微博 | 高级检索  
     

基于属性高频字的深网数据库重叠率估计
引用本文:苗忠义,赵朋朋,胡鹏旻,崔志明. 基于属性高频字的深网数据库重叠率估计[J]. 计算机工程, 2009, 35(13): 28-30
作者姓名:苗忠义  赵朋朋  胡鹏旻  崔志明
作者单位:苏州大学智能信息处理及应用研究所,苏州,215021;苏州大学智能信息处理及应用研究所,苏州,215021;苏州大学智能信息处理及应用研究所,苏州,215021;苏州大学智能信息处理及应用研究所,苏州,215021
基金项目:国家自然科学基金资助项目,2005年度教育部科研基金资助重点项目,2006年江苏省"六大人才高峰"基金资助项目,2006年度江苏省软件和集成电路业专项经费基金资助项目,2007年度江苏省研究生创新计划基金资助项目 
摘    要:在同一领域中,不同Web数据库之间有重叠部分,为估计重叠部分在Web数据库中所占比例,提出一种基于属性高频字的重叠率估计方法。以中文高频字作为起点,迭代诱导属性高频字。通过属性高频字的查询结果计算匡叠部分出现的条件概率,进而估计重叠率。实验证明,该方法的偏差度和波动度都小于5。

关 键 词:重叠率  深网  数据库  估计
修稿时间: 

Estimation for Overlapping Rate of Deep Web Databases Based on Attribute High-frequency Words
MIAO Zhong-yi,ZHAO Peng-peng,HU Peng-yu,CUI Zhi-ming. Estimation for Overlapping Rate of Deep Web Databases Based on Attribute High-frequency Words[J]. Computer Engineering, 2009, 35(13): 28-30
Authors:MIAO Zhong-yi  ZHAO Peng-peng  HU Peng-yu  CUI Zhi-ming
Affiliation:Institute of Intelligent Information Processing and Application;Suzhou University;Suzhou 215021
Abstract:In the same domain, different Web databases have overlap with each other.In order to estimate the overlapping rate in Web database, this paper proposes an attribute high-frequency words based approach for estimating the overlapping rate of Deep Web database.Starting with the Chinese frequency words, the attribute frequency words can be induced iterative, and using its query results calculate the conditional probability of overlapping part, then estimate the overlapping rate.Experiments prove its bias and vo...
Keywords:overlapping rate  Deep Web  database  estimation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号