首页 | 本学科首页   官方微博 | 高级检索  
     

基于统计语言模型的蒙古文词切分
引用本文:侯宏旭,刘群,那顺乌日图,牧仁高娃,李锦涛.基于统计语言模型的蒙古文词切分[J].模式识别与人工智能,2009,22(1).
作者姓名:侯宏旭  刘群  那顺乌日图  牧仁高娃  李锦涛
作者单位:1. 中国科学院计算技术研究所,智能信息处理萤点实验室,北京,100190;内蒙古大学,计算机学院,呼和浩特,010021;中国科学院研究生院,北京,100190
2. 中国科学院计算技术研究所,智能信息处理萤点实验室,北京,100190
3. 内蒙古大学,计算机学院,呼和浩特,010021
基金项目:内蒙古自治区自然科学基金,国家重点基础研究发展规划(973计划)
摘    要:通过对蒙古文词切分技术的分析,利用规则作为切分的基础,提出一种统计和规则相结合的蒙古文词切分方法.这种方法利用蒙古语统计语言模型作为排歧依据,使用的语言模型有基于词性的语言模型和Skip-N语言模型.其词切分准确率比基于规则的系统有较大提高.

关 键 词:蒙古语  词切分  语言模型  词干词缀

Mongolian Word Segmentation Based on Statistical Language Model
HOU Hong-Xu,LIU Qua,Nasanurtu,Murengaowa,LI Jin-Tao.Mongolian Word Segmentation Based on Statistical Language Model[J].Pattern Recognition and Artificial Intelligence,2009,22(1).
Authors:HOU Hong-Xu  LIU Qua  Nasanurtu  Murengaowa  LI Jin-Tao
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号