首页 | 本学科首页   官方微博 | 高级检索  
     

一种对英文字符串进行分词的方法*
引用本文:邹智敏,郭荷清,高英.一种对英文字符串进行分词的方法*[J].计算机应用研究,2007,24(7):52-54.
作者姓名:邹智敏  郭荷清  高英
作者单位:华南理工大学,计算机科学与工程学院,广东,广州,510641
基金项目:国家重点基础研究发展计划(973计划) , 广东省广州市科技攻关项目
摘    要:对Aho-Corasick算法略作改变,用一个收词丰富的有优先级的字典构造Aho-Corasick树,并利用它对英文字符串进行字典匹配.对匹配的结果,利用后缀词按优先级排序的特点设计了一个高效的分词算法.实验证明该算法具有高效性.

关 键 词:字典匹配  英文分词  后缀词  英文  字符串  分词算法  方法  Method  Segmentation  String  高效性  验证  设计  级排序  后缀词  结果  匹配  利用  构造  字典  收词
文章编号:1001-3695(2007)07-0052-03
修稿时间:2006-06-072006-08-04

English String Segmentation Method
ZOU Zhi min,GUO He qing,GAO Yin.English String Segmentation Method[J].Application Research of Computers,2007,24(7):52-54.
Authors:ZOU Zhi min  GUO He qing  GAO Yin
Affiliation:(College of Computer Science & Engineering, South China University of Technology, Guangzhou Guangdong 510641, China)
Abstract:Aho-Corasick algorithm was changed slightly,and a priority-ranked dictionary with plentiful words was used to construct Aho-Corasick tree.A dictionary pattern matching was carried out using this tree.Observing the suffix words were ordered by priority in the result of dictionary pattern matching,a high efficient algorithm was designed to segment English string.The experiment also proves the algorithm's efficiency.
Keywords:dictionary pattern matching  English string segmentation  suffix word
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号