首页 | 本学科首页   官方微博 | 高级检索  
     

数据集成中的一种数据合并技术
引用本文:董树明,徐文胜,董逸生.数据集成中的一种数据合并技术[J].现代计算机,2003(11):6-9,36.
作者姓名:董树明  徐文胜  董逸生
作者单位:东南大学计算机科学与工程系 南京210096 (董树明,徐文胜),东南大学计算机科学与工程系 南京210096(董逸生)
摘    要:本文讨论了在数据集成过程中遇到的数据合并问题,主要包括重复记录判断(对象识别技术)和重复记录的冲突处理(冲突解决机制)等,提出了比较实用、有效的方法,并通过实验对多表合并的两种算法进行了比较,指出了需要进一步改进的方向。

关 键 词:数据集成  数据合并  数据质量  数据源  数据模式  数据处理

A Technology of Data Merging in Data Integration
DONG Shu-ming,XU Wen-sheng,DONG Yi-Sheng.A Technology of Data Merging in Data Integration[J].Modem Computer,2003(11):6-9,36.
Authors:DONG Shu-ming  XU Wen-sheng  DONG Yi-Sheng
Abstract:This paper presentes some problems and their solutions when carrying out data integrating. The problems mainly include duplicated records identification (Object Identification Technique) and confilict processing for duplicated records (Conflict Resolution Mechanism). We propose a practical and available method and according our experiment results we compare two merging algorithms merging multiple tables into one target table.At last we pointe out some aspects that needs to improve.
Keywords:Information Integration  Object Identification  Conflict Resolution  ETL  
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号