首页 | 本学科首页   官方微博 | 高级检索  
     

基于条件随机场的冠词选择研究
引用本文:宁伟,蔡东风,张桂平,季铎,苗雪雷.基于条件随机场的冠词选择研究[J].中文信息学报,2008,22(6):116-122.
作者姓名:宁伟  蔡东风  张桂平  季铎  苗雪雷
作者单位:沈阳航空工业学院 知识工程中心,辽宁 沈阳110034
基金项目:国家高技术研究发展计划(863计划),国家高技术研究发展计划(863计划)
摘    要:冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。针对传统的基于规则和机器学习的方法,只考虑名词短语前冠词选择的问题,该文将冠词看作一种标记,将该问题形式化地描述为一个序列标注任务,提出一种基于条件随机场的解决策略,选取特征时充分利用词、词性等多层次资源,并引入前后词的互信息。实验采用包含91 106个冠词的专利摘要做测试语料,F值达到80%。

关 键 词:人工智能  机器翻译  冠词选择  条件随机场  序列标注  互信息  

Research on Article Choice Based on Conditional Random Fields
NING Wei,CAI Dong-feng,ZHANG Gui-ping,JI Duo,MIAO Xue-lei.Research on Article Choice Based on Conditional Random Fields[J].Journal of Chinese Information Processing,2008,22(6):116-122.
Authors:NING Wei  CAI Dong-feng  ZHANG Gui-ping  JI Duo  MIAO Xue-lei
Affiliation:Knowledge Engineering Research Center, Shenyang Institute of Aeronautical Engineering,
Shenyang, Liaoning 110034, China
Abstract:Article choice is a difficult problem for Chinese to English translation since it involves complex knowledge about grammar,semantics and the world.Traditional researches based on rule or machine learning only deal with articles used in the noun phrases.This paper considers the article as a label and hence treats the problem as a sequence labeling task,proposing a strategy based on Conditional Random Fields.In the process of feature extraction,the proposed method makes good use of the word and part-of-speech,especially the mutual information feature.Experimental results on testing corpus composed of patent abstracts containing 91 106 articles show that the algorithm yields F-score of 80%.
Keywords:artificial intelligence  machine translation  article choice  conditional random fields  sequence labeling  mutual information
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号