首页 | 本学科首页   官方微博 | 高级检索  
     

偏最小二乘判别分析结合F-score用于蛋白质组学质谱数据的特征筛选(英文)
引用本文:张明锦,杜一平,张世芝. 偏最小二乘判别分析结合F-score用于蛋白质组学质谱数据的特征筛选(英文)[J]. 计算机与应用化学, 2012, 29(12): 1467-1470
作者姓名:张明锦  杜一平  张世芝
作者单位:1. 青海师范大学化学系,青海,西宁,810008
2. 上海市功能性材料化学重点实验室,华东理工大学,上海,200237
3. 青海民族大学化学与生命科学学院,青海,西宁,810007
摘    要:提出了一种基于偏最小二乘判别分析和F-score的特征筛选方法,并将其用于蛋白质组学质谱数据分析。该方法主要包含3个步骤:(1)用LIMPIC算法对原始数据进行预处理;(2)计算每个变量的F-score值并将所有变量按F-score值降底的顺序排列;(3)采用偏最小二乘判别分析交互检验按前向选择法选择最佳变量子集。用本方法对一组结肠癌数据进行分析,最终从原始的16331个质荷比变量中选择了8个特征质荷比作为潜在的生物标记物。用所选择的特征对独立测试集的样本进行判别,其灵敏度和特异性分别达到了95.24%和100%。结果表明,所提出的方法可用于蛋白质组学质谱数据的特征筛选及样本分类。

关 键 词:特征选择  质谱  F-score  偏最小二乘判别分析

Feature selection from proteomic mass spectrometric data using F-score and partial least square-discriminant analysis
Zhang Mingjin , Du Yiping , Zhang Shizhi. Feature selection from proteomic mass spectrometric data using F-score and partial least square-discriminant analysis[J]. Computers and Applied Chemistry, 2012, 29(12): 1467-1470
Authors:Zhang Mingjin    Du Yiping    Zhang Shizhi
Affiliation:1.Department of Chemistry,Qinghai Normal University,Xining,810008,Qinghai,P.R.China) (2.Key Laboratory for Advanced Materials and Research Centre of Analysis Test,East China University of Science and Technology, Shanghai,200237,P.R.China) (3.College of Chemistry and Life Science,Qinghai University for Nationalities,Xining,810007,Qinghai,P.R.China)
Abstract:
Keywords:feature selection  mass spectra  F-score  partial least square-discriminant analysis
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号