首页 | 本学科首页   官方微博 | 高级检索  
     

汉语句法树库标注体系
引用本文:周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):2-9.
作者姓名:周强
作者单位:清华大学计算机系智能技术与系统国家重点实验室
基金项目:国家自然科学基金,国家重点基础研究发展计划(973计划),国家高技术研究发展计划(863计划)
摘    要:语料库的句法标注是语料库语言学研究的前沿课题。本文在研究和总结国内外句法树库标注实践的基础上,提出了一套汉语真实文本的句法树标注体系。它以完整的层次结构树为基础,对句法树上的每个非终结符节点都给出两个标记:成分标记和关系标记,形成双标记集的句法信息描述体系。目前,这两个标记集分别包含了16和27个标记,对汉语句子的不同句法组合的外部功能分布和内部组合特点进行了详细描述。在此基础上,我们开发完成了100万词规模的汉语句法树库TCT,对其中各种复杂语言现象的标注实践显示了这套标注体系具有很好的信息覆盖率和语料适应性。

关 键 词:计算机应用  中文信息处理  句法树库  标注规范  语料库语言学  
文章编号:1003-0077(2004)04-0001-08
修稿时间:2004年2月23日

Annotation Scheme for Chinese Treebank
ZHOU Qiang.Annotation Scheme for Chinese Treebank[J].Journal of Chinese Information Processing,2004,18(4):2-9.
Authors:ZHOU Qiang
Affiliation:State Key Laboratory of Intelligent Technology and Systems Dept. of Computer Science and Technology Tsinghua University
Abstract:
Keywords:computer application  Chinese information processing  tree bank  annotation scheme  corpus linguistics
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号