首页 | 本学科首页   官方微博 | 高级检索  
     

一种规则与统计相结合的汉语分词方法
引用本文:赵伟,戴新宇,尹存燕,陈家骏.一种规则与统计相结合的汉语分词方法[J].计算机应用研究,2004,21(3):23-25.
作者姓名:赵伟  戴新宇  尹存燕  陈家骏
作者单位:南京大学,计算机科学与技术系,软件新技术国家重点实验室,江苏,南京,210093
基金项目:国家"863"基金资助项目(2001AA114102)
摘    要:汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。

关 键 词:中文信息处理  分词  语料库  交集型歧义
文章编号:1001-3695(2004)03-0023-03
修稿时间:2002年11月15

A Method Combining Rule-based and Statistics-based Approaches for Chinese Word Segmentation
ZHAO Wei,DAI Xin-yu,YIN Cun-yan,CHEN Jia-jun Technology,Nanjing University,Nanjing Jiangsu ,China.A Method Combining Rule-based and Statistics-based Approaches for Chinese Word Segmentation[J].Application Research of Computers,2004,21(3):23-25.
Authors:ZHAO Wei  DAI Xin-yu  YIN Cun-yan  CHEN Jia-jun Technology  Nanjing University  Nanjing Jiangsu  China
Affiliation:ZHAO Wei,DAI Xin-yu,YIN Cun-yan,CHEN Jia-jun Technology,Nanjing University,Nanjing Jiangsu 210093,China)
Abstract:Chinese automatic word segmentation is a basic task in the area of Chinese NLP.After summarizing and analyzing current techniques used in Chinese word segmentation,this paper presents a new method for word segmentation which is based on a marked corpus base.The method combines rule-based and corpus-based statistical methods.
Keywords:Chinese NLP  Word Segmentation  Corpus  Crossing Ambiguities
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号