首页 | 本学科首页   官方微博 | 高级检索  
     

基于规则的中文零指代项识别研究
引用本文:秦凯伟,孔芳,李培峰,朱巧明.基于规则的中文零指代项识别研究[J].计算机科学,2012,39(10):278-281.
作者姓名:秦凯伟  孔芳  李培峰  朱巧明
作者单位:1. 苏州大学计算机科学与技术学院 苏州215006
2. 江苏省计算机信息处理技术重点实验室 苏州215006
基金项目:国家自然科学基金,江苏省高校自然科学重大基础研究项目,苏州市科技计划项目
摘    要:提出了一个基于规则的中文零指代项识别方法,即输入一个句法分析树,根据这个句法分析树得到当前词的最小IP子树,再依据得到的IP子树提出中文零指代识别的一些规则。所用的语料是Ontonotes。从实验结果可以看到,该方法在标准的句法分析树上F值能达到82.45%,在自动句法树上其也能达到66.45%。从实验结果可以看出,该方法在中文零指代识别上具有很好的性能。

关 键 词:自然语言处理  中文零指代  句法分析树  基于规则  Ontonotes3.0

Rule-based Identification of Chinese zero Anaphora
QIN Kai-wei , KONG Fang , LI Pei-feng , ZHU Qiao-ming.Rule-based Identification of Chinese zero Anaphora[J].Computer Science,2012,39(10):278-281.
Authors:QIN Kai-wei  KONG Fang  LI Pei-feng  ZHU Qiao-ming
Affiliation:(School of Computer Science & Technology,Soochow University,Suzhou 215006,China)(Key Lab of Computer Information Processing Technology of Jiangsu Province,Suzhou 215006,China)
Abstract:A rule-based approach for Chinese zero anaphor detection was proposed. Given a parse tree, the smallest IP sub-tree covering the current predicate was captured. Based on this IP sub-tree, some rules were proposed for detecting whether a Chinese zero anaphor exists. I}his paper also systematically evaluated the rulcbased method on OntoNotescorpus. Using golden parse tree, our method achieves 82. 45 in F-measure. And the F-measure is 63. 84 using automatic parser. The experiment results show that our method is very effective on Chinese zero anaphor detection.
Keywords:Natural language processing  Chinese zero anaphora  Parsing tree  Rulcbased  Ontonotc3  0
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号