首页 | 本学科首页   官方微博 | 高级检索  
     

规则与统计结合的俄语基本名词短语识别
摘    要:针对目前国内鲜有研究且语料资源缺乏的俄语基本名词短语(Base Noun Phrase,Base NP)识别,提出一种规则与统计相结合的方法,其优势是在有限资源的基础上,既能充分利用俄语Base NP在词性构成上的规律特点,通过俄汉词典统计得到最佳词性搭配模式库进行模式匹配;又无需人工标注统计工具所需的训练语料,仅依靠词典和词性搭配模式库自动构建,节省标注代价。规则与统计的结合,既能在很大程度上召回Base NP,又能使用条件随机场(Conditional Random Fields,CRF)纠正规则标注的歧义和错误,处理规则未能覆盖的情况。实验表明,使用该方法实现的俄语基本名词短语识别效果良好,其F值达到了84.14%。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号