首页 | 本学科首页   官方微博 | 高级检索  
     

缺失数据处理方法的比较研究
引用本文:刘鹏 雷蕾 张雪凤. 缺失数据处理方法的比较研究[J]. 计算机科学, 2004, 31(10): 155-156
作者姓名:刘鹏 雷蕾 张雪凤
作者单位:上海财经大学经济信息管理系,上海,200433;上海财经大学经济信息管理系,上海,200433;上海财经大学经济信息管理系,上海,200433
基金项目:上海财经大学"211工程"重点学科建设项目资助(2004[9]).
摘    要:数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯补缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。

关 键 词:数据挖掘  缺失值  朴素贝叶斯分类器  信息增益

A Comparison Study of Missing Value Processing Methods
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号