未登录词识别算法的改进 |
| |
作者姓名: | 蔡勇智 |
| |
作者单位: | 福州大学计算机系,福建,福州,350002 |
| |
摘 要: | 未登录词识别是中文分词系统的两大难题之一。它时提高中文分词最终的正确率和召回率起着重要的作用。本文提出一种改进的未登录词识别算法,通过统计分析大规模语料库及未登录词词表,对前人的成词规则进行改进.并结合限制性成分时所识别的未登录词进行纠正,得出较准确的未登录词识别结果。该算法是规则和统计相结合并且侧重于规则的识别算法,是中文分词中比较有效的未登录词识别算法之一。
|
关 键 词: | 未登录词 同时识别 中文分词 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|