首页 | 本学科首页   官方微博 | 高级检索  
     

自动提取词汇化树邻接文法
引用本文:许云,樊孝忠,张锋. 自动提取词汇化树邻接文法[J]. 计算机应用, 2005, 25(1): 4-6. DOI: 10.3724/SP.J.1087.2005.00004
作者姓名:许云  樊孝忠  张锋
作者单位:北京理工大学,计算机科学与工程系,北京,100081;北京理工大学,计算机科学与工程系,北京,100081;北京理工大学,计算机科学与工程系,北京,100081
基金项目:云南省信息技术项目基金资助项目(2002IT03)
摘    要:
提出了一种从宾州中文语料库中自动提取词汇化树邻接文法(LTAG)的算法。该算法的主要思想是从词汇化树库中归纳出三种类型的词汇化树,然后利用了中心词驱动短语结构文法的方法从语料库自动提取结构合理的词汇化树;最后由语言规则对不合法的词汇化树进行过滤。与手工创建词汇化树邻接文法相比,它需要较少的人力,并且避免了人工创建词汇化树可能造成的遗漏或不一致现象。

关 键 词:词汇化树邻接文法  词汇化树  语料库  自然语言处理
文章编号:1001-9081(2005)01-0004-03
修稿时间:2004-07-08

Auto extracting for lexicalized tree adjoining grammar
XU Yun,FAN Xiao-zhong,ZHANG Feng. Auto extracting for lexicalized tree adjoining grammar[J]. Journal of Computer Applications, 2005, 25(1): 4-6. DOI: 10.3724/SP.J.1087.2005.00004
Authors:XU Yun  FAN Xiao-zhong  ZHANG Feng
Affiliation:epartment of Computer Science & Engineering, Beijing Institution of Technology
Abstract:
An algorithm of the extracting Lexicalized Tree Adjoining Grammar(LTAG) from Penn Chinese corpus was presented. Idea of the algorithm is to induce three kinds of trees from lexicalized tree bank. Then the method of Head-driven Phrase Structure Grammar(HPSG) was applied to extract lexicalized tree from corpus. In the end, invalid lexicalized trees were filtered out by linguistic rules. It requires fewer human efforts compared with hand-crafted grammar. It is possible to remedy omission of grammatical syntactic structures in hand-crafted grammar.
Keywords:lexicalized tree adjoining grammar  lexicalized tree  corpus  natural language processing  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号