首页 | 本学科首页   官方微博 | 高级检索  
     

短语树到依存树的自动转换研究
引用本文:党政法,周强. 短语树到依存树的自动转换研究[J]. 中文信息学报, 2005, 19(3): 22-28
作者姓名:党政法  周强
作者单位:清华大学智能技术与系统国家重点实验室计算机科学与技术系,北京 100084
基金项目:国家自然科学基金,国家重点基础研究发展计划(973计划),国家高技术研究发展计划(863计划)
摘    要:不同标注体系的树库之间的相互转换是计算语言学研究的重要内容之一。本文在总结国内外几种树库标注体系及相互转换实践的基础上,结合清华汉语树库(Tsinghua Chinese Treebank ,简称TCT) 标注体系的特点,提出了一种将TCT从短语结构转换成依存结构(Dependency Structure) 的算法。这种算法充分利用了TCT具有的功能、结构的双重标记,转换得到的依存树不仅包含了各个节点之间相互依存的层次关系,更包含了相互依存的两个节点的具体的依存关系类型。我们对转换的效果进行了抽样评估,准确率可以达到97137 %。

关 键 词:人工智能  自然语言处理  树库  短语树  依存树  自动转换  
文章编号:1003-0077(2005)03-0021-07
修稿时间:2004-06-06

Automatically Convert Treebank from Phase Structure to Dependency Structure
DANG Zheng-fa,ZHOU Qiang. Automatically Convert Treebank from Phase Structure to Dependency Structure[J]. Journal of Chinese Information Processing, 2005, 19(3): 22-28
Authors:DANG Zheng-fa  ZHOU Qiang
Affiliation:State Key Laboratory of Intelligent Technology and Systems Dept . of Computer Science and Technology ,Tsinghua University , Beijing 100084 , China
Abstract:Automatically conversion between different annotated treebank is an important subject of natural language processing. After a brief summarization of several treebank annotation schema and conversion between them, we proposed a new converting algorithm to automatically convert Tsinghua Chinese Treebank(TCT for brief) from phase structure to dependency structure. This algorithm makes full use of syntactic constituent tag and grammatical relation tag of TCT, and generates dependency structure treebank. The output dependency treebank indicates not only hierarchy dependency relationship between nodes, but also specified type of such dependency relationship. Precision of the conversion reaches 97.37%.
Keywords:artificial intelligence  natural language processing  treebank  phrase structure  dependency structure  automatically convert
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号