首页 | 本学科首页   官方微博 | 高级检索  
     

一种非清洁数据库的数据模型
引用本文:王宏志,李建中,高宏.一种非清洁数据库的数据模型[J].软件学报,2012,23(3):539-549.
作者姓名:王宏志  李建中  高宏
作者单位:哈尔滨工业大学计算机科学与技术系,黑龙江哈尔滨,150001
基金项目:国家自然科学基金(61003046,60933001);国家重点基础研究发展计划(973)(2012CB316200);中国博士后科学基金(201003447);教育部博士点基金(20102302120054);哈尔滨工业大学优秀青年教师培养计划(HITQNJS.2009.052);数据工程与知识工程教育部重点实验室(中国人民大学)开放课题(KF2011003)
摘    要:非清洁数据为数据管理带来了新的挑战,当前,处理非清洁的数据清洗方法在实际应用中存在一定的局限性,因此需要在一定程度上容忍非清洁数据的存在.这样,研究管理包含非清洁数据的数据库管理技术就成为了重要的问题,其核心在于如何从包含非清洁数据的数据库中得到满足应用所要求的清洁度的查询结果.从非清洁数据处理角度出发,提出了一种非清洁数据库的数据模型.该模型提出了非清洁数据的表示方法,支持非清洁数据的数据操作,并且支持数据操作清洁度的计算,同时还讨论了查询表达式的等价转换规则和模型的初步实现.

关 键 词:数据质量  非清洁数据  数据模型  查询处理
收稿时间:2010/5/21 0:00:00
修稿时间:2011/4/28 0:00:00

Data Model for Dirty Databases
WANG Hong-Zhi,LI Jian-Zhong and GAO Hong.Data Model for Dirty Databases[J].Journal of Software,2012,23(3):539-549.
Authors:WANG Hong-Zhi  LI Jian-Zhong and GAO Hong
Affiliation:(Department of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)
Abstract:Dirty data brings new challenges for data management.Current methods of dirty data management are mainly data cleaning.Such methods have limitations when dealing with in applications.In some systems,dirty data has to be tolerated.Therefore,the management of databases with dirty data becomes an important issue.The crucial problem is to obtain query result with a clean degree satisfying clean requirement of applications from databases with dirty data.From the aspect of dirty data management,a data model for dirty databases is presented in this paper.This paper proposes the representation of dirty data,data operators for dirty data and the computation method of clean degree of tuples with support of data operation.The equivalent transformation rules for query expressions on dirty data and the preliminary implementation of the data model are also discussed in this paper.
Keywords:data quality  dirty data  data model  query processing
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号