基于词频学习和动态词频更新的藏文自动分词系统设计 |
| |
引用本文: | 项 炜 金 澎. 基于词频学习和动态词频更新的藏文自动分词系统设计[J]. 计算机应用与软件, 2014, 0(5): 106-109 |
| |
作者姓名: | 项 炜 金 澎 |
| |
作者单位: | ;1.乐山师范学院智能信息处理及应用实验室;2.乐山师范学院计算机科学学院 |
| |
摘 要: | 藏文自动分词问题是藏文自然语言处理的基本问题之一。针对藏文自动分词中的重点难点,例如:格助词的识别、歧义切分、未登录词识别技术设计一个新的藏文自动分词系统。该系统采用动态词频更新和基于上下文词频的歧义处理和未登录词识别技术。在歧义字段分词准确性、未登录词识别率和分词速度上,该系统具有较优的性能。
|
关 键 词: | 藏文自动分词 自然语言处理 格助词 动态词频更新 歧义处理 未登录词识别 |
DESIGN OF AUTOMATIC TIBETAN WORD SEGMENTATION SYSTEM BASED ON WORD FREQUENCY LEARNING AND DYNAMIC WORD FREQUENCY UPDATING |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |