首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的中文分词正向最大匹配算法
引用本文:王瑞雷,栾静,潘晓花,卢修配. 一种改进的中文分词正向最大匹配算法[J]. 计算机应用与软件, 2011, 28(3)
作者姓名:王瑞雷  栾静  潘晓花  卢修配
作者单位:新疆师范大学计算机科学技术学院,新疆,乌鲁木齐,830054
基金项目:新疆师范大学研究生科技创新活动基金
摘    要:正向最大匹配分词FMM(Forward Maximum Matching)算法存在设定的最大词长初始值固定不变的问题,带来长词丢失或匹配次数较多的弊端.针对此问题提出了根据中文分词词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法.与此相配合,设计了一种词典结构,使之能够有效地支持改进的算法.改进的算法与一般正向最大匹配算法相比大大减少了匹配次数,分析表明中文分词的速度和效率有了很大提高.

关 键 词:中文分词  分词词典  正向最大匹配算法

AN IMPROVED FORWARD MAXIMUM MATCHING ALGORITHM FOR CHINESE WORD SEGMENTATION
Wang Ruilei,Luan Jing,Pan Xiaohua,Lu Xiupei. AN IMPROVED FORWARD MAXIMUM MATCHING ALGORITHM FOR CHINESE WORD SEGMENTATION[J]. Computer Applications and Software, 2011, 28(3)
Authors:Wang Ruilei  Luan Jing  Pan Xiaohua  Lu Xiupei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号