首页 | 本学科首页   官方微博 | 高级检索  
     

自扩充中文分词词典的研究与实现
引用本文:马志强,周长胜,丁维,杨娜. 自扩充中文分词词典的研究与实现[J]. 计算机与数字工程, 2007, 38(6): 143-146
作者姓名:马志强  周长胜  丁维  杨娜
作者单位:北京机械工业学院计算机及自动化系,北京,100085
摘    要:中文分词词典是中文自动分词的一个核心技术,词条的完备率和词典的结构,在一定程度上决定着分词的正确率和查询速度.为了提高以上两方面的性能,从计算机技术层面上讨论,给出两种改进的词典组织结构和一种自动扩充词条的方法.

关 键 词:词典  整词二分  TRIE索引树  自扩充算法  中文自动分词  分词词典  研究  方法  组织结构  改进  技术层面  计算机  性能  查询速度  正确率  程度  完备率  词条  一个核心
修稿时间:2006-09-11

Research and Implement of Lexicon Enlarged Jtself
Ma Zhiqiang. Research and Implement of Lexicon Enlarged Jtself[J]. Computer and Digital Engineering, 2007, 38(6): 143-146
Authors:Ma Zhiqiang
Affiliation:Ma Zhiqiang
Abstract:Chinese word segment lexicon is a core technology of word segmentation. The integrality of the word item and the lexicon's structure decide the precision and the searching speed of the word segmentation on a certain degree. To improve the capability above, this paper introduces two lexicon's structures improved and a kind of method of enlarging items itself on the computer technology level.
Keywords:lexicon   binary-seek-by-word   TRIE lndexing tree  enlarging itself algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号