首页 | 本学科首页   官方微博 | 高级检索  
     

基于多特征融合编码的神经网络依存句法分析模型
引用本文:刘明童,张玉洁,徐金安,陈钰枫. 基于多特征融合编码的神经网络依存句法分析模型[J]. 中文信息学报, 2018, 32(12): 41-47
作者姓名:刘明童  张玉洁  徐金安  陈钰枫
作者单位:北京交通大学 计算机与信息技术学院,北京 100044
基金项目:中央高校基本科研业务费专项资金(2018YJS025,2015JBM033);国家自然科学基金(61370130,61473294);科学技术部国际科技合作计划(K11F100010);国家自然科学基金(61876198)
摘    要:在基于神经网络的依存句法分析中,对分析栈和决策层信息的表示和利用依然有值得深入研究的空间。针对分析栈的表示,已有工作并没有对单棵依存子树独立编码的表示,导致无法利用各个依存子树的局部特征;也没有对生成的依存弧序列进行编码,导致无法利用依存弧的全局信息。针对决策层的表示,已有工作利用MLP预测转移动作,该结构无法利用历史决策动作的信息。对此,该文提出基于多特征融合编码的神经网络依存句法分析模型,基于依存子树和历史生成的依存弧表示分析栈,利用TreeLSTM网络编码依存子树信息,利用LSTM网络编码历史生成的依存弧序列,以更好地表示分析栈的局部信息和全局信息。进一步提出基于LSTM网络的结构预测转移动作序列,引入历史决策动作信息作为特征辅助当前决策。该文以汉语为具体研究对象,在CTB5汉语依存分析数据上验证所提出的多特征融合编码的神经网络模型。实验结果显示,汉语依存句法分析性能得到改进,在目前公布的基于转移的分析系统中取得最好成绩,在UAS和LAS评价指标上分别达到87.8%和86.8%的精度,表明所提出的对依存子树局部特征及历史依存弧信息和历史决策动作信息的编码方法,在改进依存分析模型性能方面的有效性。

关 键 词:依存句法分析  多特征融合编码  依存子树  TreeLSTM神经网络  

A Neural Transition-based Dependency Parsing Model with Fused Multi-feature Encoding
LIU Mingtong,ZHANG Yujie,XU Jin’an,CHEN Yufeng. A Neural Transition-based Dependency Parsing Model with Fused Multi-feature Encoding[J]. Journal of Chinese Information Processing, 2018, 32(12): 41-47
Authors:LIU Mingtong  ZHANG Yujie  XU Jin’an  CHEN Yufeng
Affiliation:School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China
Abstract:For neural networks based dependency parsing, this paper presents a novel architecture for transition-based dependency parsing leveraging fused multi-feature encoding. We model the stack states based on subtrees representations and encode structural dependency subtrees with TreeLSTM. Particularly, we propose a LSTM-based technique to encode the historical parsed dependency arcs and states as global features. Finally, based on fused multi-feature encoding, we combine the extracted local features and global features for parsing decision. Experiments on Chinese Penn TreeBank (CTB5) show that our parser reaches 87.8% (unlabeled) and 86.8% (labeled) attachment accuracy with a greedy strategy, which effectively improves neural transition-based dependency parsing.
Keywords:dependency parsing    multi-feature encoding    dependency subtree    TreeLSTM neural network  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号