首页 | 本学科首页   官方微博 | 高级检索  
     

巧用黑盒法逆推百度中文分词算法
引用本文:盛启东,谭守标,徐超,冯二媛,陈军宁.巧用黑盒法逆推百度中文分词算法[J].计算机技术与发展,2010,20(4):136-139.
作者姓名:盛启东  谭守标  徐超  冯二媛  陈军宁
作者单位:安徽大学,电子科学与技术学院,安徽,合肥,230039
摘    要:为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术.笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象.介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法--正向最大匹配分词算法.该算法是最常见的一种中文分词算法,比较符合人的思维习惯.了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进.

关 键 词:中文分词  分词算法  搜索引擎  百度

Inferring Baidu's Chinese Word Segmentation Algorithm by Supposing a Black Box
SHENG Qi-dong,TAN Shou-biao,XU Chao,FENG Er-yuan,CHEN Jun-ning.Inferring Baidu's Chinese Word Segmentation Algorithm by Supposing a Black Box[J].Computer Technology and Development,2010,20(4):136-139.
Authors:SHENG Qi-dong  TAN Shou-biao  XU Chao  FENG Er-yuan  CHEN Jun-ning
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号