首页 | 本学科首页   官方微博 | 高级检索  
     

基于加权Bayes分类器的流数据在线分类算法研究
引用本文:卢惠林.基于加权Bayes分类器的流数据在线分类算法研究[J].计算机科学,2014,41(5):227-229,234.
作者姓名:卢惠林
作者单位:哈尔滨工业大学计算机学院 哈尔滨150001 江苏省无线传感系统应用技术研发中心 无锡214153
基金项目:本文受国家自然科学基金(61170121)资助
摘    要:传统的分类算法在对模型进行训练之前,需要得到整个训练数据集。然而在大数据环境下,数据以数据流的形式源源不断地流向系统,因此不可能预先获得整个训练数据集。研究了大数据环境下含有噪音的流数据的在线分类问题。将流数据的在线分类描述成一个优化问题,提出了一种加权的Nave Bayes分类器和一种误差敏感的(Error Adaptive)分类器,并通过真实的数据集对提出的算法进行了验证。实验结果表明,文中提出的误差敏感的分类器算法在系统没有噪音的情况下分类预测的准确性要优于相关的算法;此外,当流数据中含有噪音时,误差敏感的分类器算法对噪音不敏感,仍然具有很好的预测准确性,因此可以应用于大数据环境下流数据的在线分类预测。

关 键 词:大数据  决策树  分类算法  流数据
收稿时间:2013/7/15 0:00:00
修稿时间:2013/9/23 0:00:00

Weighted Bayes Based Data Streaming Online Classification Algorithm
LU Hui-lin.Weighted Bayes Based Data Streaming Online Classification Algorithm[J].Computer Science,2014,41(5):227-229,234.
Authors:LU Hui-lin
Affiliation:School of Computer,Harbin Industrial University,Harbin 150001,ChinaJiangsu Engineering Technology Development Center on Wireless Sensor System,Wuxi 214153,China
Abstract:
Keywords:Big data  Decision tree  Classification algorithm  Data streaming
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号