首页 | 本学科首页   官方微博 | 高级检索  
     

中文分词算法在搜索引擎应用中的研究
引用本文:欧振猛. 中文分词算法在搜索引擎应用中的研究[J]. 计算机工程与应用, 2000, 36(8): 80-82,84
作者姓名:欧振猛
作者单位:中山大学电子系,广州
摘    要:在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。

关 键 词:搜索引擎  中文自动分词  匹配  马尔可夫过程

Research of Chinese Word Automatic Segmentation used in Search Engine
Ou Zhenmeng YuShunzheng. Research of Chinese Word Automatic Segmentation used in Search Engine[J]. Computer Engineering and Applications, 2000, 36(8): 80-82,84
Authors:Ou Zhenmeng YuShunzheng
Affiliation:Ou Zhenmeng YuShunzhengDepartment of Radio Electronics,Zhongshan University
Abstract:During the period of rapid progress of Information Infrastructure Superhighway, Search Engine is a powerfultool for deriving valuable information. The core of Chinese Search Engine is the key content extracting, and the bottleneck is Chinese Word Automatic Segmentation.This algorithm uses the optimum matching method which is based onautomatic building dictionary to perform the Chinese word automatic segmentation, then resolves ambiguity with meliorative Markoff statistics process in order to enhance precision.
Keywords:Search Engine   Chinese Word Automatic Segmentation   Matching   Markoff process
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号