一种中文分词词典新机制-四字哈希机制 |
| |
引用本文: | 张培颖,李村合.一种中文分词词典新机制-四字哈希机制[J].微计算机应用,2006,27(4):512-512. |
| |
作者姓名: | 张培颖 李村合 |
| |
作者单位: | 中国石油大学(华东)计算机与通信工程学院,东营,257061 |
| |
摘 要: | 国内自80年代中后期就开展了中文分词词典机制的研究,目前已有的分词词典机制主要有:基于整词二分的词典机制、基于TRIE,索引树的词典机制和双字哈希机制。笔者根据中文中四字成语较多的特点对双字哈希机制扩展到四字哈希机制,下面介绍其分词词典的数据结构和查找算法。
|
关 键 词: | 分词词典 机制 哈希 中文 TRIE 查找算法 数据结构 中后期 索引树 二分 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|