首页 | 本学科首页   官方微博 | 高级检索  
     

基于不完全数据的数据挖掘方法研究
引用本文:吴新玲. 基于不完全数据的数据挖掘方法研究[J]. 计算机工程与设计, 2006, 27(9): 1557-1559
作者姓名:吴新玲
作者单位:广东技术师范学院,信息工程系,广东,广州,510262;武汉大学,软件工程国家重点实验室,湖北,武汉,430072
摘    要:
将不完全数据分为了两类:属性值残缺和属性值隐含.对基于这两类不完全数据的数据挖掘方法分别进行了探讨,给出了相应的处理方法,并对这些方法及其应用进行了讨论.属性值残缺的处理主要采用一系列"补漏"的方法,使数据成为完全数据集;属性值隐含的处理则通过EM算法来优化模型的参数,弥补数据的不完全性.

关 键 词:数据挖掘  数据处理  期望最大化算法  数据模型  参数估计
文章编号:1000-7024(2006)09-1557-03
收稿时间:2005-03-03
修稿时间:2005-03-03

Research of data mining based on incomplete data
WU Xin-ling. Research of data mining based on incomplete data[J]. Computer Engineering and Design, 2006, 27(9): 1557-1559
Authors:WU Xin-ling
Affiliation:1. Department of Information Engineering, GuangDong Polytechnic Normal University, Guangzhou 510262, China; 2. State-key Lab of Software Engineering, Wuhan University, Wuhan 430072, China
Abstract:
It is divided into two classes for incomplete data: The attribute values missing and the attribute values concealed.The data mining methods based on these two kinds of incomplete data are explored.The methods to process these two kinds of incomplete data are presented and the applications about these methods are discussed.Some prosthesis methods are used to process the attribute values missing situation and make the data complete.The EM algorithm is used to process the attribute values concealed situation and make the model parameters more suitable.
Keywords:data mining   data processing   EM algorithm   data model   parameter estimate
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号