首页 | 本学科首页   官方微博 | 高级检索  
     

基于集成学习的人类LncRNA大数据基因预测
引用本文:于彬,李珊,陈成,陈瑞欣,田保光. 基于集成学习的人类LncRNA大数据基因预测[J]. 青岛科技大学学报(自然科学版), 2018, 0(1): 106-113
作者姓名:于彬  李珊  陈成  陈瑞欣  田保光
作者单位:青岛科技大学数理学院;
摘    要:长非编码RNA(LncRNA)在表观遗传调控、转录后调控和人类疾病中发挥着重要作用,利用机器学习方法从海量的RNA数据中识别出LncRNA十分必要。本研究提出一种基于集成学习的LncRNA大数据基因预测新方法。首先提取序列碱基出现频率的86个特征作为原始特征集合,其次,基于GA-SVM选取出最优特征,以SVM五折交叉验证的准确率作为适应度,最后构建AdaBoost算法与SVM相结合的基因预测模型(AdaBoost-SVM)。实验结果表明:AdaBoost-SVM模型对测试集LncRNA的预测准确率为89.26%,优于RF、SVM和DWT-SVM3种预测模型的结果。

关 键 词:长非编码RNA  基因预测  集成学习  AdaBoost算法  支持向量机

Prediction of Human LncRNA Big Data Genes Based on Ensemble Learning
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号