首页 | 本学科首页   官方微博 | 高级检索  
     

全二分最大匹配快速分词算法
引用本文:李振星,徐泽平,唐卫清,唐荣锡.全二分最大匹配快速分词算法[J].计算机工程与应用,2002,38(11):106-109.
作者姓名:李振星  徐泽平  唐卫清  唐荣锡
作者单位:1. 北京航空航天大学机械工程及自动化学院,北京,100083
2. 中国科学院计算技术研究所,北京,100080
摘    要:分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。

关 键 词:自动分词  中文信息处理  数据结构
文章编号:1002-8331-(2002)11-0106-04
修稿时间:2001年6月1日

Full Binsearch Maximal Match Algorithm for Chinese Word Segmentation
Li Zhenxing,Xu Zeping,Tang Weiqing,Tang Rongxi.Full Binsearch Maximal Match Algorithm for Chinese Word Segmentation[J].Computer Engineering and Applications,2002,38(11):106-109.
Authors:Li Zhenxing  Xu Zeping  Tang Weiqing  Tang Rongxi
Affiliation:Li Zhenxing 2 Xu Zeping 1 Tang Weiqing 1 Tang Rongxi 21
Abstract:C hi nese word segmentation is a very important component in many field of Chinese information process.In a lot of application(such as the text query in search e ngine,etc.),the velocity of word segmentation is paramount ,at the same ti me the precision is also needed.Based on the research of Chinese encoding arch itecture and the algorithms for Chinese word segmentation,this paper presents a new fast algorithm for Chinese word segmentation using a new data structure fo r Chinese word,and gives the implement ation course and theory analysis.
Keywords:Automatic segmentation  Chinese information process  Data structure
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号