首页 | 本学科首页   官方微博 | 高级检索  
     

基于上下文的中文分词方法
引用本文:石峰,陈珊.基于上下文的中文分词方法[J].计算机光盘软件与应用,2011(15).
作者姓名:石峰  陈珊
作者单位:1. 临沂市房产登记交易中心,山东临沂,276000
2. 临沂大学传媒学院,山东临沂,276005
摘    要:本文总结和分析了常用的中文分词方法,并提出了一种基于上下文的分词算法。算法的原理是在文档中抽取最长重复字串,进而得到索引项。这种分词方法使得分词更加简单准确。

关 键 词:中文分词  基于上下文  信息检索

Context-based Chinese Word Segmentation Method
Abstract:Chinese automatic word segmentation is a basic task in the area of Chinese Information Search Engine.ARer summarizing the current techniques used in Chinese word segmentation,this paper presents a new method for word segmentation,this arithmetic which is based on finding the longest repeated string in text can cutting words accuractcly.
Keywords:Chinese word scglnentation  Context-bascd  Information retrieval
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号