首页 | 本学科首页   官方微博 | 高级检索  
     

基于置信区间的偏离群数据检测方法
引用本文:夏秀峰,谢光宇,石祥滨,徐蕾.基于置信区间的偏离群数据检测方法[J].计算机工程,2008,34(21):12-14,1.
作者姓名:夏秀峰  谢光宇  石祥滨  徐蕾
作者单位:沈阳航空工业学院汁算机学院,沈阳,110136
基金项目:辽宁省自然科学基金资助项目(20052007)
摘    要:异常数据检测与处理是数据仓库系统中数据清洗领域的研究热点。该文提出一种基于置信区间的偏离群数据检测方法,从总体中筛选出有效样本,利用遗传算法从中找到可信样本,利用可信样本确定置信区间,基于置信区间对总体进行检测及处理。该方法所处理的数据不需要与时间相关,且可以快速地识别、检测出大数据量中的“脏数据”。实验结果表明,该方法能有效地解决无规则状态下的偏离群数据的检测,并在实际应用中取得了良好效果。

关 键 词:脏数据  置信区间  偏离群数据  遗传算法

Detection Method of Deviated Group Data Based on Confident Interval
XIA Xiu-feng,XIE Guang-yu,SHI Xiang-bin,XU Lei.Detection Method of Deviated Group Data Based on Confident Interval[J].Computer Engineering,2008,34(21):12-14,1.
Authors:XIA Xiu-feng  XIE Guang-yu  SHI Xiang-bin  XU Lei
Affiliation:(School of Computer, Shenyang Institute of Aeronautical Engineering, Shenyang 110136)
Abstract:It is a hot topic to detect and dispose the exceptional data in the field of data-cleansing operation of data warehouse system.After analyzing the current detection technology,a detection method of the deviated group data based on confident interval is proposed,in which an effective stylebook is screened out from the group data,a credible stylebook is found from the effective stylebook using a genetic arithmetic,a confident interval is obtained based on credible stylebook,then the group data will be detecte...
Keywords:dirty data  confident interval  deviated group data  genetic arithmetic
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号