首页 | 本学科首页   官方微博 | 高级检索  
     

信息集成中数据获取关键技术的研究
引用本文:缪嘉嘉,李爱平,贾焰,吴泉源.信息集成中数据获取关键技术的研究[J].计算机研究与发展,2007,44(Z3):452-457.
作者姓名:缪嘉嘉  李爱平  贾焰  吴泉源
作者单位:国防科学技术大学计算机学院,长沙,410073
基金项目:国家高技术研究发展计划(863计划) , 国家重点基础研究发展计划(973计划)
摘    要:信息集成是消除信息孤岛,实现信息共享,为企业决策提供支持的核心技术,而数据获取过程是信息集成系统的基础.在数据同步更新研究中,通过根据失配元组的间隔自适应调整窗口大小,在不牺牲效率的前提下有效提高快照差分算法的查全率.进一步,在相似重复记录检测方法的研究中,结合一种新的字符串距离度量算法,并利用二次聚类,提出一种高效的基于条件概率分布的相似重复记录检测方法.最后通过实验对比测试,对快照差分算法以及相似重复记录检测算法的性能和效率进行分析,理论分析和实验结果均证明了提出的改进算法是非常有效的.

关 键 词:数据集成  快照差分算法  相似重复记录检测  概率后缀树  信息集成  数据获取  研究  Information  Integration  Data  Key  Technologies  改进算法  结果  理论  分析  算法的性能  相似重复记录检测  对比测试  实验  概率分布  条件  聚类  利用  度量算法  字符串距离
修稿时间:2007年7月5日

Research on Key Technologies for Data Extracting in Information Integration
Miao Jiajia,Li Aiping,Jia Yan,Wu Quanyuan.Research on Key Technologies for Data Extracting in Information Integration[J].Journal of Computer Research and Development,2007,44(Z3):452-457.
Authors:Miao Jiajia  Li Aiping  Jia Yan  Wu Quanyuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号