首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的统计与后串最大匹配的中文分词算法研究
引用本文:吴涛,张毛迪,陈传波.一种改进的统计与后串最大匹配的中文分词算法研究[J].计算机工程与科学,2008,30(8):79-82.
作者姓名:吴涛  张毛迪  陈传波
作者单位:华中科技大学软件学院,湖北,武汉,430074
基金项目:国家高技术研究发展计划(863计划)
摘    要:在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确性、效率以及生词辨识上取得了良好的效果。

关 键 词:正向最大前串匹配  逆向最大前串匹配  统计法  有穷自动机

Research of Chinese Word Segmentation Algorithms Based on Statistics and Reverse Maximum Match
WU Tao,ZHANG Mao-di,CHEN Chuan-bo.Research of Chinese Word Segmentation Algorithms Based on Statistics and Reverse Maximum Match[J].Computer Engineering & Science,2008,30(8):79-82.
Authors:WU Tao  ZHANG Mao-di  CHEN Chuan-bo
Abstract:This paper analyzes several traditional methods for the Chinese word segmentation,compares the advantages and disadvantages of these methods,and presents a new segmentation algorithm.The method adopts the improved bidirectional Markov chain statistical method to update the word library,and then uses the Reverse Maximum Match method based on the word library and the GameTree search algorithm to cut the Chinese word strings.The experimental results show this algorithm has got better effect on veracity,efficiency and new word distinguishment.
Keywords:forward maximum match  reverse maximum match  statistical method  definite finite automation
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号