首页 | 本学科首页   官方微博 | 高级检索  
     

基于高阶词汇依存的短语结构树重排序模型
引用本文:王志国,宗成庆.基于高阶词汇依存的短语结构树重排序模型[J].软件学报,2012,23(10):2628-2642.
作者姓名:王志国  宗成庆
作者单位:模式识别国家重点实验室中国科学院 自动化研究所,北京 100190
基金项目:国家自然科学基金(60975053,61003160);中国科学院对外合作交流项目
摘    要:在句法分析中,已有研究工作表明,词汇依存信息对短语结构句法分析是有帮助的,但是已有的研究工作都仅局限于使用一阶的词汇依存信息.提出了一种使用高阶词汇依存信息对短语结构树进行重排序的模型,该模型首先为输入句子生成有约束的搜索空间(例如,N-best句法分析树列表或者句法分析森林),然后在约束空间内获取高阶词汇依存特征,并利用这些特征对短语结构候选树进行重排序,最终选择出最优短语结构分析树.在宾州中文树库上的实验结果表明,该模型的最高F1值达到了85.74%,超过了目前在宾州中文树库上的最好结果.另外,在短语结构分析树的基础上生成的依存结构树的准确率也有了大幅提升.

关 键 词:短语结构  依存结构  句法重排序  高阶词汇依存关系  句法森林
收稿时间:2011/5/13 0:00:00
修稿时间:2012/2/15 0:00:00

Phrase Parses Reranking Based on Higher-Order Lexical Dependencies
WANG Zhi-Guo and ZONG Cheng-Qing.Phrase Parses Reranking Based on Higher-Order Lexical Dependencies[J].Journal of Software,2012,23(10):2628-2642.
Authors:WANG Zhi-Guo and ZONG Cheng-Qing
Affiliation:(National Laboratory of Pattern Recognition(Institute of Automation,The Chinese Academy of Sciences),Beijing 100190,China)
Abstract:The existing works on parsing show that lexical dependencies are helpful for phrase tree parsing.However, only first-order lexical dependencies have been employed and investigated in previous research. Thispaper proposes a novel method for employing higher-order lexical dependencies for phrase tree evaluation. Themethod is based on a parse reranking framework, which provides a constrained search space (via N-best lists orparse forests) and enables the parser to employ relatively complicated lexical dependency features. The models areevaluated on the UPenn Chinese Treebank. The highest F1 score reaches 85.74% and has outperformed allpreviously reported state-of-the-art systems. The dependency accuracy of phrase trees generated by the parser hasbeen significantly improved as well.
Keywords:phrase structure  dependency structure  parse reranking  higher-order lexical dependencies  parseforest
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号