首页 | 本学科首页   官方微博 | 高级检索  
     

人类基因PolyA位点预测
引用本文:廖堃,段江波,周艳红. 人类基因PolyA位点预测[J]. 计算机学报, 2008, 31(6): 927-933
作者姓名:廖堃  段江波  周艳红
作者单位:华中科技大学生物信息与分子成像湖北省重点实验室,武汉,430074
基金项目:国家自然科学基金 , 教育部高等学校博士学科点专项科研基金 , 科技部国家科技基础条件平台建设专项
摘    要:mRNA 3′端的多聚腺苷酸化是真核细胞内mRNA转录后处理的三个最主要步骤之一.对DNA序列上发生多聚腺苷酸化的位置即PolyA位点的识别,对于理解mRNA的形成机制以及进行基因结构预测具有重要作用.本研究利用机器学习方法对PolyA位点进行预测,其实现过程分为以下三个步骤:特征的生成、特征的筛选、特征的综合分析聚类.首先,我们采取统计k阶核苷酸频率的方法来生成初始的特征;然后,通过信息学知识来对特征进行筛选;最后,使用SVM(Support Vector Machines,支持向量机)的方法进行特征的综合分析,确定参数,建立预测模型.在独立的测试数据集上进行测试,当敏感度(Sn)固定为60%时,在内含子水平和外显子水平上的特异性(Sp)分别为71.67%和80.77%,在内含子水平上的预测精度明显优于国际上的同类软件.

关 键 词:PolyA信号  机器学习    支持向量机

Prediction of Polyadenylation in Human Gene Sequences
LIAO Kun,DUAN Jiang-Bo,ZHOU Yan-Hong. Prediction of Polyadenylation in Human Gene Sequences[J]. Chinese Journal of Computers, 2008, 31(6): 927-933
Authors:LIAO Kun  DUAN Jiang-Bo  ZHOU Yan-Hong
Abstract:
Keywords:Polyadenylation signals  machine learning  entropy  support vector machines
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号