首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进整词二分法的中文分词词典设计
引用本文:谭骏珊,吴惠雄.一种改进整词二分法的中文分词词典设计[J].信息技术,2009(5).
作者姓名:谭骏珊  吴惠雄
作者单位:中南林业科技大学计算机科学学院,长沙,410004
摘    要:汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率.针对常用的分词方法--正向匹配分词法的特征,在已有整词二分词典的基础上加以改进,设计了一种基于Hash索引、二叉树以及动态一维数组结构的中文分词词典,相对于传统的基于Hash索引的分词词典,减小了词典的空间复杂度,提高了汉语分词的速度,最主要的是改进后的词典在增添新词时比以往的词典更为容易.

关 键 词:汉语分词  词典查询  中文信息处理

Design of Chinese word segmentation dictionary based on traditional dictionary
TAN Jun-shan,WU Hui-xiong.Design of Chinese word segmentation dictionary based on traditional dictionary[J].Information Technology,2009(5).
Authors:TAN Jun-shan  WU Hui-xiong
Affiliation:School of Computer Science;Central South University of Forestry and Technology;Changsha 410004;China
Abstract:Chinese word segmentation dictionary is the important base of Chinese information processing system.The arithmetic of the dictionary influences the speed and efficiency of segmentation.This paper designs a new Chinese word segmentation dictionary based on the improved traditional binary-seek-by-word dictionary.The dictionary uses less memory.The experiment shows that the dictionary has high efficiency and is easy to build.
Keywords:Chinese word segmentation  search dictionary  Chinese information processing  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号