首页 | 本学科首页   官方微博 | 高级检索  
     

基于Hash结构的逆向最大匹配分词算法的改进
引用本文:丁振国,张卓,黎靖. 基于Hash结构的逆向最大匹配分词算法的改进[J]. 计算机工程与设计, 2008, 29(12)
作者姓名:丁振国  张卓  黎靖
作者单位:西安电子科技大学,计算机学院,陕西,西安,710071
基金项目:国家高技术研究发展计划(863计划) , 军队网络互联与信息安全策略研究基金
摘    要:分析中文的语义,首先要对句子进行分词.中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果.对传统的分词词典和算法进行了改进,提出了基于Hash结构的分词词典机制,并给出了一种改进的逆向最大匹配分词算法(RMM).该算法在重点考虑切分速度的同时兼顾了切分精度,在很大程度上消除了传统的最大匹配算法可能产生的歧义.实验结果表明,该分词算法在运行效率和结果的准确性方法有了很大的提高.

关 键 词:中文分词  哈希结构  逆向最大匹配算法  分词词典  消除歧义

Improvement on reverse directional maximum matching method based on hash structure for Chinese word segmentation
DING Zhen-guo,ZHANG Zhuo,LI Jing. Improvement on reverse directional maximum matching method based on hash structure for Chinese word segmentation[J]. Computer Engineering and Design, 2008, 29(12)
Authors:DING Zhen-guo  ZHANG Zhuo  LI Jing
Affiliation:DING Zhen-guo,ZHANG Zhuo,LI Jing(College of Computer Science,Xidian University,Xi'an 710071,China)
Abstract:To analyse the Chinese semantic phrases,one must divide the sentences into words.Chinese segmentation is the most important part of Chinese information process.The speed and accuracy of segmentation influence the results of information processing.Traditional dictionary mechanisms and word segmentation methods are improved.Meanwhile,a new dictionary mechanism is provided based on hash structure,and an improved reverse directional maximum match method(RMM) is put forward.This method emphasized particularly on...
Keywords:Chinese segmentation  hash structure  reverse directional maximum match method  dictionary mechanism  dispel ambiguity  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号