基于统计的开放式汉语自动分词 |
| |
引用本文: | 吴东峥.基于统计的开放式汉语自动分词[J].福建电脑,2009,25(3):85-85. |
| |
作者姓名: | 吴东峥 |
| |
作者单位: | 集美大学计算机工程学院,福建厦门,361021 |
| |
摘 要: | 汉语自动分词在面向大规模真实文本时,仍然存在很多困难。本文在传统的语料库方法的基础上,提出一种基于开放性语料库的汉语自动分词方法。建立开放性语料库,并引入开放式知识库学习和评价机制。实验结果表明,开放机制的引入能有效提高汉语自动分词的精确率。
|
关 键 词: | 汉语自动分词 机器学习 开放式语料库 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|