基于上下文的中文分词方法 |
| |
引用本文: | 石峰,陈珊.基于上下文的中文分词方法[J].计算机光盘软件与应用,2011(15). |
| |
作者姓名: | 石峰 陈珊 |
| |
作者单位: | 1. 临沂市房产登记交易中心,山东临沂,276000 2. 临沂大学传媒学院,山东临沂,276005 |
| |
摘 要: | 本文总结和分析了常用的中文分词方法,并提出了一种基于上下文的分词算法。算法的原理是在文档中抽取最长重复字串,进而得到索引项。这种分词方法使得分词更加简单准确。
|
关 键 词: | 中文分词 基于上下文 信息检索 |
Context-based Chinese Word Segmentation Method |
| |
Abstract: | Chinese automatic word segmentation is a basic task in the area of Chinese Information Search Engine.ARer summarizing the current techniques used in Chinese word segmentation,this paper presents a new method for word segmentation,this arithmetic which is based on finding the longest repeated string in text can cutting words accuractcly. |
| |
Keywords: | Chinese word scglnentation Context-bascd Information retrieval |
本文献已被 万方数据 等数据库收录! |
|