首页 | 本学科首页   官方微博 | 高级检索  
     

从真实语料中自动获取汉语动词次范畴化信息
引用本文:韩习武,赵铁军. 从真实语料中自动获取汉语动词次范畴化信息[J]. 计算机工程与应用, 2005, 41(19): 1-4,181
作者姓名:韩习武  赵铁军
作者单位:哈尔滨工业大学计算机学院,哈尔滨,150001;哈尔滨工业大学计算机学院,哈尔滨,150001
基金项目:国家自然科学基金项目“汉语动词次范畴化自动获取技术的研究”(编号:60373101)
摘    要:描述了一种自动获取汉语动词次范畴化信息的可行技术和一个从大规模真实文本中构建动词次范畴化词汇知识库的系统性实验。实验基于语言学启发信息生成次范畴化框架假设,然后应用统计方法进行假设检验。对20个句模多元化动词获取结果的初步评价表明,该技术已经达到了目前国际上同类研究相应水平的精确率和召回率;并且,所得知识库在一个PCFG句法分析器上的简单应用体现了次范畴化信息在自然语言处理领域有着可观的潜在价值。

关 键 词:汉语动词  谓词  次范畴化  次范畴化框架
文章编号:1002-8331-(2005)19-0001-04

Acquiring Subcategorization Information from Real Corpus for Chinese Verbs
Han Xiwu,Zhao Tiejun. Acquiring Subcategorization Information from Real Corpus for Chinese Verbs[J]. Computer Engineering and Applications, 2005, 41(19): 1-4,181
Authors:Han Xiwu  Zhao Tiejun
Abstract:This paper describes the proper technology of subcategorization acquisition for Chinese verbs and a comprehensive experiment of acquiring relevant subcategorization lexical knowledge.The hypotheses for subcategorization frames are generated by means of linguistic heuristic information and tested via statistic methods.Evaluation on the acquisition of 20 multi-pattern verbs shows that the experiment achieves the similar precision and recall with relevant international researches.Besides,simple application of the acquired lexicon in a PCFG parser indicates great potentials of subcategorization information in the fields of NLP.
Keywords:Chinese verb  predicate  subcategorization  subcategorization frame
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号