首页 | 官方网站   微博 | 高级检索  
     

随机森林针对小样本数据类权重设置
引用本文:李建更,高志坤.随机森林针对小样本数据类权重设置[J].计算机工程与应用,2009,45(26):131-134.
作者姓名:李建更  高志坤
作者单位:北京工业大学人工智能与机器人研究所,北京,100124
基金项目:国家自然科学基金,北京市自然科学基金,北京市教育委员会科技计划项目 
摘    要:随机森林已经被证明是一种高效的分类与特征选择方法。尽管参数的设置对结果影响较小,但合适的参数可以使分类器得到理想的效果。主要针对癌症研究中小样本不均衡数据的分类和特征选择问题,研究了随机森林中类权重的设置。为了比较在不同的类权重下特征选择的效果,同时使用支持向量机(Support Vector Machine,SVM)方法。最终结果显示最优的类权重是不确定的。最后总结出几条规律指导研究者选择合适的权重使分类和特征选择效果得到改善。

关 键 词:随机森林  类权重  小样本  支持向量机  特征选择
收稿时间:2008-5-15
修稿时间:2008-9-1  

Setting of class weights in random forest for small-sample data
LI Jian-geng,GAO Zhi-kun.Setting of class weights in random forest for small-sample data[J].Computer Engineering and Applications,2009,45(26):131-134.
Authors:LI Jian-geng  GAO Zhi-kun
Affiliation:LI Jian-geng,GAO Zhi-kun Institute of Artificial Intelligence , Robotics,Beijing University of Technology,Beijing 100124,China
Abstract:Random forest has been proved to be an efficient algorithm for classification and feature selection in bioinformatics.Although the effect of parameter setting on results is very limited,a group of appropriate parameters can generate excellent performance.This paper focuses on the setting of class weights in random forest to deal with classification and feature selection problems of unbalanced small-sample data and determines the optimal class weight.In order to compare the performance of feature selection w...
Keywords:random forest  class weight  small-sample  Support Vector Machine(SVM)  feature selection
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号