首页 | 本学科首页   官方微博 | 高级检索  
     

改进LPU用于蛋白质功能预测
引用本文:陈义明,李舟军,刘军万. 改进LPU用于蛋白质功能预测[J]. 计算机工程与科学, 2011, 33(12): 148-152
作者姓名:陈义明  李舟军  刘军万
作者单位:(1.国防科学技术大学计算机学院,湖南 长沙 410073;2.湖南农业大学信息科学技术学院,湖南 长沙 410128)
摘    要:本文将蛋白质功能预测定义为典型的LPU问题。针对有很少正例的LPU算法存在的不平衡或过拟合问题,提出了基于最近邻和凸组合理论的创建人工正例扩充正例集合的方法,同时使用一类支持向量机获取初始最可能的负例,通过迭代两类支持向量机将分类超平面移到一个合适的位置,由交叉验证获得代表性的负例,从而改进了典型LPU算法学习最优分类器的过程。针对酵母基因组数据的实验表明:我们的算法在很少正例的功能类上的预测性能有显著提高,在其他类上的性能也有一定的改善。

关 键 词:蛋白质功能预测   支持向量机   LPU
收稿时间:2009-09-07
修稿时间:2009-12-15

Improving LPU for Protein Function Prediction
CHEN Yi-ming , LI Zhou-jun , LIU Jun-wan. Improving LPU for Protein Function Prediction[J]. Computer Engineering & Science, 2011, 33(12): 148-152
Authors:CHEN Yi-ming    LI Zhou-jun    LIU Jun-wan
Affiliation:(1.School of Computer Science,National University of Defense and Technology,Changsha 410073;2.School of Information Science and Technology,Hunan Agricultural University,Changsha 410128,China)
Abstract:This paper formulates the protein function prediction into a typical LPU.Aiming at imbalance or over-fitting from LPU with few positive examples,it proposes a method creating synthetic examples to enlarge the set of positive examples based on the nearest neighbor and convex combination,and meanwhile modifies the procedure learning optimal classifier for the classic LPU algorithm by using one-class SVM(support vector machine) to identify the most probable negative examples,running iteratively SVM to move the classification hyperplane to a suitable place and obtaining representative negative examples through cross validation.For the yeast genomic data,the experiments show that our algorithm outperforms several classic prediction methods,particularly,for function classes with few positive examples.
Keywords:protein function prediction  SVM  LPU
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号