基于SVM的蛋白质亚细胞定位预测 |
| |
作者姓名: | 刘清华 赖裕平 丁洪伟 杨志军 崔晓龙 |
| |
作者单位: | 1.云南大学 信息学院,昆明 650500
2.北方工业大学 计算机学院,北京 100144
3.云南大学 微生物研究所,昆明 650500 |
| |
基金项目: | 国家自然科学基金(No.61461053,No61461054,No.61072079) |
| |
摘 要: | 首先基于特征融合思想,采用氨基酸组成、熵密度和自相关系数结合的方式构建190维特征向量进行特征表达,与仅考虑氨基酸组成信息的传统方法相比,能更好地表达蛋白质结构信息。然后利用LDA(Linear Discriminant Analysis)方法进行降维,降低计算复杂性,加强同类样本间的相关性。接下来选用支持向量机作为分类器进行定位预测,最后采用留一法在Gram-negative和Gram-positive数据集上进行交叉检验。实验结果表明,多特征结合的方法优于传统的氨基酸组成方法和简单的自相关系数方法,证明了新方法的有效性。
|
关 键 词: | 特征融合 熵密度 自相关系数 线性判别分析(LDA) 支持向量机 |
本文献已被 维普 等数据库收录! |
| 点击此处可从《计算机工程与应用》浏览原始摘要信息 |
|
点击此处可从《计算机工程与应用》下载全文 |
|