首页 | 本学科首页   官方微博 | 高级检索  
     

四种基本统计句法分析模型在汉语句法分析中的性能比较
引用本文:孟遥,李生,赵铁军,曹海龙.四种基本统计句法分析模型在汉语句法分析中的性能比较[J].中文信息学报,2003,17(3):2-9.
作者姓名:孟遥  李生  赵铁军  曹海龙
作者单位:哈尔滨工业大学计算机科学与技术学院
基金项目:国家自然科学基金资助项目 ( 69775 0 17),国家“八六三”高技术研究发展计划基金资助项目( 863- 30 6- 12 0 0 1AA11410 1)
摘    要:统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验,在已有的10000句汉语树库基础上,测试了这四种经典模型在现有数据规模下各自的性能,并论述了这四种经典模型的各自特点。本文旨在通过对四种基本模型的比较研究,为具体应用中句法分析模型的选择提供参考和依据。

关 键 词:计算机应用  中文信息处理  统计句法分析  基本模型  汉语分析  
文章编号:1003-0077(2003)03-0001-08
修稿时间:2002年10月25

A Comparative Study of Four Primary Statistical Models in Chinese Parsing
MENG Yao,LI Sheng,ZHAO Tie-jun,CAO Hai-long.A Comparative Study of Four Primary Statistical Models in Chinese Parsing[J].Journal of Chinese Information Processing,2003,17(3):2-9.
Authors:MENG Yao  LI Sheng  ZHAO Tie-jun  CAO Hai-long
Affiliation:School of Computer Science and Technology, Harbin Institute of Technology
Abstract:Choosing the statistical model is the key problem in statistical parsing. Statistical model lies in the core of NLP parsing. This paper investigates 4 primary statistical parsing models, namely PCFG, history-based model, cascading parsing model and head-driven parsing model, and compares their performances in a 10000 Chinese treebank. The analysis based on the experiment were shown in the paper. The comparative study of these models can be exploited to build the practical and effective Chinese parser.
Keywords:computer application  Chinese information processing  statistical parsing  primary statistical models  Chinese parsing
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号