首页 | 本学科首页   官方微博 | 高级检索  
     

生物文本中蛋白质名称的识别*
引用本文:王浩畅,赵铁军,于浩.生物文本中蛋白质名称的识别*[J].计算机应用研究,2007,24(1):100-102.
作者姓名:王浩畅  赵铁军  于浩
作者单位:哈尔滨工业大学,计算机与技术学院,黑龙江,哈尔滨,150001
基金项目:国家自然科学基金资助项目(60302021)
摘    要:随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长,因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫,识别生物文献中的命名实体如蛋白质、基因、脱氧核糖核酸名称等成为生物信息学中信息抽取的最基本任务。介绍了国际同类研究中生物命名实体识别的各种方法,重点介绍了蛋白质名称识别的相关方法、所用资源、实验结果及与国际同类研究的比较结果。

关 键 词:生物信息    命名实体识别    机器学习    特征选择
文章编号:1001-3695(2007)01-0100-03
修稿时间:2005-10-14

Protein Name Recognition from Biological Text
WANG Hao chang,ZHAO Tie jun,YU Hao.Protein Name Recognition from Biological Text[J].Application Research of Computers,2007,24(1):100-102.
Authors:WANG Hao chang  ZHAO Tie jun  YU Hao
Affiliation:(School of Computer Science & Technology, Harbin Institute of Technology, Harbin Heilongjiang 150001, China)
Abstract:The genome sequence has ushered in a new era of rapid and exponential growth of data related to the biology community.Thus,there is a clear need in this area for automatic methods of extracting specific information directly relating to the interests of biology researchers.Name Entity(NE) such as protein,gene,DNA,etc.recognized from biological literature is a fundamental task in information extraction of bioinformatics.This paper introduces various methods of biological name entity recognition in international research on this area.Then the methods are presented with the relevant corpus and experiment results for protein name recognition.The promising results are gotten compared with the other state-of-the-art research.
Keywords:Bioinformatics  Name Entity Recognition  Machine Learning  Feature Selection
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号