首页 | 本学科首页   官方微博 | 高级检索  
     

一种应用组合特征的中文未登录词词性猜测研究
引用本文:张海军,冯冲,史树敏,黄河燕.一种应用组合特征的中文未登录词词性猜测研究[J].小型微型计算机系统,2010,31(7).
作者姓名:张海军  冯冲  史树敏  黄河燕
作者单位:1. 中国科学技术大学,计算机科学与技术学院,安徽,合肥,230027;中国科学院,计算机语言信息工程研究中心,北京,100097
2. 中国科学院,计算机语言信息工程研究中心,北京,100097
3. 中国科学院,计算机语言信息工程研究中心,北京,100097;北京理工大学,计算机科学与技术学院,北京,100081
基金项目:国家自然科学基金项目,国家"八六三"高技术研究发展计划项目 
摘    要:未登录词词性猜测是未登录词识别的重要步骤.论文中应用条件随机域模型,使用词的外部和内部特征(组合特征),进行中文未登录词的词性猜测.文中提出增加一种新颖的内部特征-汉字偏旁,来提高词性猜测效果.试验表明,使用组合特征的词性猜测方法是有效的,汉字偏旁的加入能显著提高词性猜测的准确性,开放试验的准确率达到94.67%.实验还初步证明,将汉字偏旁作为内部特征,在词法分析方面,具有一定的实用价值.

关 键 词:中文分词  未登录词  条件随机域模型  词性猜测

Applying Multi-features on POS Tag Guessing of Unknown Chinese Words
ZHANG Hai-jun,FENG Chong,SHI Shu-min,HUANG He-yan.Applying Multi-features on POS Tag Guessing of Unknown Chinese Words[J].Mini-micro Systems,2010,31(7).
Authors:ZHANG Hai-jun  FENG Chong  SHI Shu-min  HUANG He-yan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号