首页 | 本学科首页   官方微博 | 高级检索  
     

基于多核学习的医学文献蛋白质关系抽取
引用本文:唐楠,杨志豪,林鸿飞,李彦鹏.基于多核学习的医学文献蛋白质关系抽取[J].计算机工程,2011,37(10):184-186.
作者姓名:唐楠  杨志豪  林鸿飞  李彦鹏
作者单位:大连理工大学计算机科学与技术学院,辽宁,大连,116024
基金项目:国家自然科学基金资助项目,国家"863"计划基金资助项目
摘    要:从生物医学文献中抽取蛋白质交互作用关系对蛋白质知识网络的建立、新药的研制等均具有重要的意义。为此,提出一种基于多核学习的方法,用于从文献中自动抽取蛋白质关系信息。该方法融合基于特征的核、树核以及图核,并扩展最短路径依存树以及依存路径以利用更多的上下文关系信息。在AImed语料上的实验得到63.9%的F值和87.83%的AUC值,表明该方法具有较好的性能。

关 键 词:文本挖掘  信息抽取  蛋白质关系抽取  核方法  多核学习

Protein-protein Interaction Extraction from Medical Literature Based on Multiple Kernels Learning
TANG Nan,YANG Zhi-hao,LIN Hong-fei,LI Yan-peng.Protein-protein Interaction Extraction from Medical Literature Based on Multiple Kernels Learning[J].Computer Engineering,2011,37(10):184-186.
Authors:TANG Nan  YANG Zhi-hao  LIN Hong-fei  LI Yan-peng
Affiliation:(College of Computer Science and Technology,Dalian University of Technology,Dalian 116024,China)
Abstract:Automatic extracting protein-protein interaction information from biomedical literature can help to build protein relation network and design new drugs.This paper presents a multiple kernels learning based approach to automatically extract protein-protein interactions from biomedical literature.The approach combines feature-based kernel,tree kernel and graph kernel.In particular,it extends shortest path-enclosed tree and dependency path tree to capture richer contextual information.Experimental evaluations show that the method can achieve state-of-the-art performance with respect to comparable evaluations,with 63.9% F-score and 87.83% AUC on the AImed corpus.
Keywords:text mining  information extraction  protein-protein interaction extraction  kernel method  multiple kernels learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号