首页 | 本学科首页   官方微博 | 高级检索  
     

不完整数据库中的数据挖掘
引用本文:印鉴,周祥福,杨敏.不完整数据库中的数据挖掘[J].计算机工程,2006,32(12):34-36.
作者姓名:印鉴  周祥福  杨敏
作者单位:中山大学计算机科学系,广州,510275;中山大学附属第三医院,广州,510630
基金项目:国家高技术研究发展计划(863计划);广东省博士启动基金;国家科技计划;广东省科技计划;广东省广州市科技计划
摘    要:数据挖掘是从数据中提取有用知识的过程。在现实生活中,数据丢失的情况是很常见的,尤其是在商业数据库中,由于文件错误、纪录缺失、存储策略的改变等都会引起数据丢失而造成数据库的不完整。这种不完整性会影响关联规则的挖掘过程,因为在有数据缺失时对规则的支持度以及可信度的计算都得不到确定值。把Apriori算法应用于不完整数据库,基于期望支持度和期望可信度,给出了一个挖掘不完整事务数据库中关联规则的算法。

关 键 词:不完整数据库  数据挖掘  关联规则  期望支持度  期望可信度
文章编号:1000-3428(2006)12-0034-03
收稿时间:08 22 2005 12:00AM
修稿时间:2005-08-22

Data Mining in Incomplete Database
YIN Jian,ZHOU Xiangfu,YANG Min.Data Mining in Incomplete Database[J].Computer Engineering,2006,32(12):34-36.
Authors:YIN Jian  ZHOU Xiangfu  YANG Min
Affiliation:1. Department of Computer Science, Zhongshan Univ., Guangzhou 510275; 2. Third Affiliated Hospital, Zhongshan Univ., Guangzhou 510630
Abstract:Data mining is the process of discovering knowledge frora the data. In real life, missing data often occur in database, especially in business ones. Many factors, such as file errors, missing records and changes in the database schema, will give rise to missing data. This incompleteness will affect the process of discovering association rules because the support and confidence of rules will be uncertain. This paper applies the Apriori algorithm to an incomplete database, and based on expected support and confidence, it proposes an algorithm to mine association rules in an incomplete database. Experiments show that it is an efficient method.
Keywords:Incomplete database  Data mining  Association rules  Expected support  Expected confidence
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号