首页 | 本学科首页   官方微博 | 高级检索  
     

分层次的汉语功能块描述库构建分析
引用本文:陈亿,周强,宇航.分层次的汉语功能块描述库构建分析[J].中文信息学报,2008,22(3):24-32.
作者姓名:陈亿  周强  宇航
作者单位:语音与语言技术中心,清华大学 信息科学与技术国家实验室筹,
清华大学 计算机科学与技术系,北京 100084
基金项目:国家自然科学基金 , 国家高技术研究发展计划(863计划)
摘    要:现有功能块分析器对于不同长度和不同结构功能块的分析性能研究表明,长的结构复杂的功能块正是功能块自动分析的难点所在。由此,我们设计了新的分层次的功能块体系,并从清华句法树库TCT中自动生成了新的功能块语料库。通过对新的功能块语料库长度分布、内部结构分布分析,以及与单层次功能块语料库的相互关系的研究,我们证实了新的分层次功能块描述体系具有结构简单、长度短且分布均匀的优良特点。这些性质对功能块分析器的性能提高将会有很大的帮助。

关 键 词:计算机应用  中文信息处理  部分分析  功能块  分层次描述  
文章编号:1003-0077(2008)03-0024-08
修稿时间:2007年6月30日

Analysis of the Hierarchical Chinese Functional Chunk Bank
CHEN Yi,ZHOU Qiang,YU Hang.Analysis of the Hierarchical Chinese Functional Chunk Bank[J].Journal of Chinese Information Processing,2008,22(3):24-32.
Authors:CHEN Yi  ZHOU Qiang  YU Hang
Affiliation:Center for Speech and Language Technologies,
Tsinghua National Laboratory for Information Science and Technology,
Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China
Abstract:Through an experimental analysis of the relation between the length and the structure of functional chunks and the performance of the parser,this paper reveals that it is the long,complex-structured functional chunks that are the major difficulty in parsing.Therefore,this paper proposes a new hierarchical functional chunk scheme and automatically generates the new functional chunk bank from Tsinghua Chinese Tree Bank(TCT).Further extensive researches about the length and structure distribution of the new chunk bank indicates that the new functional chunks bear short length and simple structure,which will help to improve the performance of functional chunk parser.
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号