首页 | 本学科首页   官方微博 | 高级检索  
     

基于混合统计模型的中文基本名词短语识别
引用本文:谭魏璇,孔芳,倪吉,周国栋. 基于混合统计模型的中文基本名词短语识别[J]. 计算机应用与软件, 2011, 28(8)
作者姓名:谭魏璇  孔芳  倪吉  周国栋
作者单位:1. 苏州大学计算机科学与技术学院,江苏,苏州,215006
2. 江苏省计算机信息处理技术重点实验室,江苏,苏州,215006
摘    要:采用一种基于混合统计模型的方法来实现中文基本名词短语识别。首先简要分析目前的研究现状,明确中文Base NP识别的任务,然后采用以基于转换的标注和条件随机域模型为底层,支持向量机模型为高层的混合统计模型来进行中文BaseNP的识别。在ACE2005中文语料上的实验表明,F值比使用单一模型提高了1.37%,达到了88.67%,能提高中文基本名词短语的识别性能。

关 键 词:基本名词短语  支持向量机模型  特征模板  

A MIXED STATISTICAL MODEL-BASED METHOD FOR IDENTIFYING CHINESE BASE NOUN PHRASE
Tan Weixuan,Kong Fang,Ni Ji,Zhou Guodong. A MIXED STATISTICAL MODEL-BASED METHOD FOR IDENTIFYING CHINESE BASE NOUN PHRASE[J]. Computer Applications and Software, 2011, 28(8)
Authors:Tan Weixuan  Kong Fang  Ni Ji  Zhou Guodong
Affiliation:Tan Weixuan Kong Fang Ni Ji Zhou Guodong(School of Computer Science and Technology,Soochow University,Suzhou 215006,Jiangsu,China)(Jiangsu Key Lab for Computer Information Processing Technology,China)
Abstract:This paper proposes a mixed statistical model based method for identifying Chinese base noun phrase(NP).After the brief overview of the current study,we confirmed the mission of Chinese base NP identification,and then adopted mixed statistical model,which consists a base tier of conversion-based tagging and conditional random field model and a senior tier of SVM model,to conduct the identification of Chinese base NP.Experiment on ACE 2005 Chinese corpus shows that the F-measure of the mixed model achieves 8...
Keywords:Base noun phrase Support vector machine(SVM) Feature template  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号