首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵方法的中英文基本名词短语识别
引用本文:周雅倩,郭以昆,黄萱菁,吴立德.基于最大熵方法的中英文基本名词短语识别[J].计算机研究与发展,2003,40(3):440-446.
作者姓名:周雅倩  郭以昆  黄萱菁  吴立德
作者单位:复旦大学计算机科学与工程系,上海,200433
基金项目:国家自然科学基金 ( 69873 0 11),Intel中国研究中心基金
摘    要:使用了基于最大熵的方法识别中文基本名词短语。在开放语料Chinese TreeBank上,只使用词性标注,达到了平均87.43%/88.09%的查全率/准确率。由于,关于中文的基本名词短语识别的结果没有很好的可比性,又使用相同的算法,尝试了英文的基本名词短语识别的结果没有很好的可比性,又使用相同的算法,尝试了英文的基本名词短语识别。在英文标准语料TREEBANKⅡ上,开放测试达到了93.31%/93.04%的查全率/准确率,极为接近国际最优水平。这既证明了此算法的行之有效,又表明该方法的语言无关性。

关 键 词:最大熵  基本名词短语  自然语言处理

Chinese and English BaseNP Recognition Based on a Maximum Entropy Model
ZHOU Ya Qian,GUO Yi Kun,HUANG Xuan Jing,and WU Li De.Chinese and English BaseNP Recognition Based on a Maximum Entropy Model[J].Journal of Computer Research and Development,2003,40(3):440-446.
Authors:ZHOU Ya Qian  GUO Yi Kun  HUANG Xuan Jing  and WU Li De
Abstract:
Keywords:maximum entropy  BaseNP  natural language processing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号