首页 | 本学科首页   官方微博 | 高级检索  
     

基于条件随机场的有标记联合结构自动识别
引用本文:王东波,陈小荷,年洪东.基于条件随机场的有标记联合结构自动识别[J].中文信息学报,2008,22(6):3-7.
作者姓名:王东波  陈小荷  年洪东
作者单位:南京师范大学 文学院,江苏 南京 210097
摘    要:文章介绍了条件随机场的基本原理,基于识别有标记联合结构的需要,根据有标记联合结构的语言学特征结合条件随机场的特性确定了条件随机场的7词位标注集、具有18个复杂特征的模板、增加4个语言学特征的模板。使用北京大学《人民日报》语料和清华大学973树库语料,基于复杂特征的特征模板和增加语言学特征的特征模板在含有嵌套的联合结构、无嵌套联合结构和最长联合结构语料上进行了实验,开放测试的调和平均值最高分别达到了88.21%, 87.85%和84.42%。

关 键 词:计算机应用  中文信息处理  有标记联合结构  条件随机场  特征模板  

Automatic Identification Of Coordination with Overt Conjunctions Based on Conditional Random Fields
WANG Dong-bo,CHEN Xiao-he,NIAN Hong-dong.Automatic Identification Of Coordination with Overt Conjunctions Based on Conditional Random Fields[J].Journal of Chinese Information Processing,2008,22(6):3-7.
Authors:WANG Dong-bo  CHEN Xiao-he  NIAN Hong-dong
Affiliation:School of Chinese Language and Literature, Nanjing Normal University,Nanjing,Jiangsu 210097,China
Abstract:After introducing the basic principle of Conditional Random Fields(CRF),this article first defines the tag set with 7 words based on linguistic characteristic of Chinese coordination with overt conjunctions.Then it designs feature templates with 18 complex features and additional 4 linguistic features respectively for the CRF based identification of the coordination with overt conjunctions.Experiments on nesting coordination,non-nesting coordination and longest coordination in the Peking University Corpus and Tsinghua University 973 Tree Bank achieve the best F-score of 88.21%,87.85% and 84.42% respectively in the open tests.
Keywords:computer application  Chinese information processing  coordination with overt conjunctions  conditional random fields  feature template
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号