首页 | 本学科首页   官方微博 | 高级检索  
     

基于人工数据产生器的噪声检测评价框架
引用本文:尹华,董红斌. 基于人工数据产生器的噪声检测评价框架[J]. 武汉大学学报(工学版), 2011, 44(5): 676-680
作者姓名:尹华  董红斌
作者单位:1. 武汉大学软件工程国家重点实验室,湖北武汉430072/广东商学院信息学院,广东广州510320
2. 武汉大学软件工程国家重点实验室,湖北武汉,430072
基金项目:国家自然科学基金项目(编号:60573038); 广东省自然科学基金项目(编号:81510521000009)
摘    要:数据挖掘中的噪声检测算法评价多以UCI真实数据为基准数据集,加入模拟的随机噪声,以除去噪声后对挖掘算法性能的提升作为检测效果的评价指标.真实数据内部结构的未知性、随机噪声水平的不确定性,评价指标的单一性使噪声检测算法评价缺乏标准,不易实现算法横向对比.基于此,首先对现有的噪声检测算法评价方法进行分析,提出基于人工数据产生器的噪声检测评价框架及组件,设计了一种基于规则的标准数据产生器及引入随机噪声模型的方法,并提供了具体的评价指标,最后对框架的合理性进行了分析.

关 键 词:噪声检测  人工数据产生器  评价指标  UCI

Noise detection algorithm evaluation based on artificial datasets generator
YIN Hua,,DONG Hongbin. Noise detection algorithm evaluation based on artificial datasets generator[J]. Engineering Journal of Wuhan University, 2011, 44(5): 676-680
Authors:YIN Hua    DONG Hongbin
Affiliation:YIN Hua1,2,DONG Hongbin1(1.State Key Laboratory of Software Engineering,Wuhan University,Wuhan 430072,China,2.Information School,Guangdong University of Business Studing,Guangzhou 510320,China)
Abstract:Noise detection algorithm evaluation is mostly based on UCI(University of California Irrine) datasets,which are injected random noise.The main evaluation index is the degree of performance elevation after handling noise.The unknown of real data structure,uncertainty of random noise level,simplicity of evaluation index make it difficult to evaluate noise detection algorithm and compare among algorithms.This article firstly analyzes the present noise detection algorithm evaluation process,and promotes the new...
Keywords:noise detection  artificial datasets generator  evaluation index  UCI  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号