首页 | 本学科首页   官方微博 | 高级检索  
     

基于锚信息的生物医学文献双语摘要句子对齐
引用本文:陈相,林鸿飞. 基于锚信息的生物医学文献双语摘要句子对齐[J]. 中文信息学报, 2009, 23(1): 58
作者姓名:陈相  林鸿飞
作者单位:大连理工大学 计算机科学与工程系,辽宁 大连 116024
基金项目:国家自然科学基金,国家高技术研究发展计划(863计划),教育部留学人员归国科研启动基金 
摘    要:双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为生物医学文献双语摘要建模。在无双语词典的情况下,将基于长度的句子对齐方法和句子的位置信息相结合,充分利用医学文献双语摘要语料中的锚信息,将生物医学摘要段落和句子进行分类计算相似度,实现了生物医学文献双语摘要的句子对齐,取得了较好的实验结果。

关 键 词:计算机应用  中文信息处理  句子对齐  二部图  双语语料  相似度
  

Sentence Alignment of Bilingual Biomedical Abstract Based on Anchor Information
CHEN Xiang,LIN Hong-fei. Sentence Alignment of Bilingual Biomedical Abstract Based on Anchor Information[J]. Journal of Chinese Information Processing, 2009, 23(1): 58
Authors:CHEN Xiang  LIN Hong-fei
Affiliation:Department of Computer Science and Engineering, Dalian University of Technology,
Dalian, Liaoning 116024, China
Abstract:Sentence alignment is an essential step in bilingual corpus processing.Sentence alignment of bilingual biomedical abstract is the first step to construct a biomedical bilingual lexicon.This paper describes a sentences alignment method using maximum weight matching on bipartite graph.After combing the sentence length and sentence location information,the anchor information is employed to calculate the paragraph similarity and sentence similarity in biomedical bilingual abstract.The good experimental results ...
Keywords:computer application  Chinese information processing  sentence alignment  bipartite graph  bilingual corpora  similarity computation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号