首页 | 本学科首页   官方微博 | 高级检索  
     

基于句子跨度的哈萨克语句法分析研究
引用本文:柴 伟,古丽拉.阿东别克.基于句子跨度的哈萨克语句法分析研究[J].计算机应用研究,2020,37(3):731-733,753.
作者姓名:柴 伟  古丽拉.阿东别克
作者单位:新疆大学 信息科学与工程学院,乌鲁木齐830046;新疆多语种信息技术实验室,乌鲁木齐830046;国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地,乌鲁木齐830046;新疆大学 信息科学与工程学院,乌鲁木齐830046;新疆多语种信息技术实验室,乌鲁木齐830046;国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地,乌鲁木齐830046
摘    要:由于目前哈萨克语句法分析准确率较低并缺乏基于神经网络的哈萨克语句法分析的相关研究,针对哈萨克语短语结构的句法分析,使用基于移进—归约的方法,采用在栈中存储句子跨度而不是部分树结构,从而在进行句法树解析时不需要对句法树进行二叉化。该研究在句子特征提取时使用双向LSTM对句子跨度特征进行提取,得到句子跨度在整个句子上下文中信息,再使用多层感知机对句法分析模型进行训练,最后在解码时使用动态规划选取最优句法分析结果;最终使得哈萨克语短语句法分析准确率达到了76.92%。研究成果对哈萨克语句法分析准确率有了进一步的提高,并为后续的哈萨克语机器翻译及语义分析奠定良好的基础。

关 键 词:双向LSTM  句子跨度  动态规划
收稿时间:2018/8/29 0:00:00
修稿时间:2020/1/21 0:00:00

Research of kazakh parsing based on span
Chai Wei and Gulila ALTENBEK.Research of kazakh parsing based on span[J].Application Research of Computers,2020,37(3):731-733,753.
Authors:Chai Wei and Gulila ALTENBEK
Affiliation:college of Information Science and Engineering,Xinjiang University,
Abstract:Due to the low accuracy of Kazakh parsing and the lack of correlation research based on neural network Kazakh parsing. This paper focused on the parsing of Kazakh phrase structure, based on the shift-reduce method, but by the stack elements were sentence spans rather than partial tree, then it didn''t need to carry out the binary tree in parsing. The resench used the bi-directional LSTM to extract the features of sentence span, and obtained the sentence span in the whole sentence context, using the multilayer perceptron to train the parsing model. In the end, the Kazakh parsing accuracy has been achieved 76.92%. The research results have improved the accuracy of Kazakh parsing and build a good foundation for Kazakh machine translation and semantic analysis.
Keywords:Bi-LSTM  span  dynamic oracle
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号