基于集成学习的人类LncRNA大数据基因预测 |
| |
引用本文: | 于彬,李珊,陈成,陈瑞欣,田保光. 基于集成学习的人类LncRNA大数据基因预测[J]. 青岛科技大学学报(自然科学版), 2018, 0(1): 106-113 |
| |
作者姓名: | 于彬 李珊 陈成 陈瑞欣 田保光 |
| |
作者单位: | 青岛科技大学数理学院; |
| |
摘 要: | 长非编码RNA(LncRNA)在表观遗传调控、转录后调控和人类疾病中发挥着重要作用,利用机器学习方法从海量的RNA数据中识别出LncRNA十分必要。本研究提出一种基于集成学习的LncRNA大数据基因预测新方法。首先提取序列碱基出现频率的86个特征作为原始特征集合,其次,基于GA-SVM选取出最优特征,以SVM五折交叉验证的准确率作为适应度,最后构建AdaBoost算法与SVM相结合的基因预测模型(AdaBoost-SVM)。实验结果表明:AdaBoost-SVM模型对测试集LncRNA的预测准确率为89.26%,优于RF、SVM和DWT-SVM3种预测模型的结果。
|
关 键 词: | 长非编码RNA 基因预测 集成学习 AdaBoost算法 支持向量机 |
Prediction of Human LncRNA Big Data Genes Based on Ensemble Learning |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|