首页 | 本学科首页   官方微博 | 高级检索  
     

借助汉-越双语词对齐语料构建越南语依存树库
引用本文:李发杰,余正涛,郭剑毅,李 英,周兰江.借助汉-越双语词对齐语料构建越南语依存树库[J].中文信息学报,2015,29(6):69-74.
作者姓名:李发杰  余正涛  郭剑毅  李 英  周兰江
作者单位:1. 昆明理工大学 信息工程与自动化学院,云南 昆明 650500;
2. 昆明理工大学 智能信息处理重点实验室,云南 昆明 650500
基金项目:国家自然科学基金(61262041,61472168);云南省自然科学基金(2013FA030)
摘    要:由于对越南语的研究工作相对较少,因此还没有建立规模相对较大的依存树库。相对于已经拥有了形态丰富、语料成熟的汉语,越南语的依存句法分析要困难得多,所以该文提出了一种借助汉-越双语词对齐语料构建越南语依存树库的方法。首先对汉语-越南语句子对进行词对齐处理,然后对汉语句子进行依存句法分析。最后结合越南语本身的语言特点和有关的语法规则将汉语的依存关系通过汉-越双语词对齐关系映射到越南语句子中,从而生成越南语的依存树库。实验表明,该方法简化了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间。实验结果表明,该方法相比采用机器学习的方法准确率明显提高。

关 键 词:越南语依存树库  汉语依存句法分析  汉-越语言对齐关系  />  

Vietnamese Dependency Treebank Construction Via Chinese-Vietnamese Bilingual Corpus
LI Fajie,YU Zhengtao,GUO Jianyi,LI Ying,ZHOU Lanjiang.Vietnamese Dependency Treebank Construction Via Chinese-Vietnamese Bilingual Corpus[J].Journal of Chinese Information Processing,2015,29(6):69-74.
Authors:LI Fajie  YU Zhengtao  GUO Jianyi  LI Ying  ZHOU Lanjiang
Affiliation:1. The School of Information Engineering and Automation, Kunming University of Science
and Technology, Kunming, Yunnan 650500,China;
2. The Key Laboratory of Intelligent Information Processing,Kunming University of Science
and Technology, Kunming, Yunnan 650500,China)
Abstract:To leverage the rich and mature Chinese corpus for Vietnamese dependency treebank, this paper presents an approach to Vietnamese Dependency Treebank construction via Chinese-Vietnamese bilingual corpus with word alignments. Based on the word alignment information, the Chinese dependency parsing is mapped into Vietnamese Dependency structure. Experimental results show that this approach can simplify the process of manual collection and annotation of Vietnamese Treebank, also can save manpower and time building the Treebank. Experimental results show that the accuracy of this method compared to machine learning methods has improved significantly. Key words vietnamese dependency treebank;chinese dependency parsing;word alignment
Keywords:vietnamese dependency treebank  chinese dependency parsing  word alignment  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号