首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于模糊聚类的汉语文本自动分类方法
引用本文:卢忠良,王家云,荣融,朱劲松,孙即祥.一种基于模糊聚类的汉语文本自动分类方法[J].计算机应用与软件,2003,20(10):49-50,61.
作者姓名:卢忠良  王家云  荣融  朱劲松  孙即祥
作者单位:1. 国防科技大学电子科学与工程学院,长沙,410073;解放军61587部队,上海,200336
2. 解放军61587部队,上海,200336
3. 国防科技大学电子科学与工程学院,长沙,410073
摘    要:如何快速地整理海量信息,对不同的文本进行有效分类,已成为获取有价值信息的瓶颈。本文提出的中文文本分类方法,较好地解决了信息的实时分类问题,在实践中收到了良好的效果。由于汉语文本的特殊性,在分类器训练前对训练文本进行自动分词和降维预处理。许多文本往往可能归到多个类,因此分类算法采用模糊c-原型算法。实验表明,该方法综合效果较好,可以实现文本的快速分类。

关 键 词:自然语言处理系统  汉语文本  自动分类方法  模糊聚类  信息处理

A METHOD OF THE CHINESE TEXTS CATEGORIZATION BASED ON FUZZY CLUSTERING
Lu Zhongliang , Wang Jiayun Rong Rong Zhu Jinsong Sun Jixiang.A METHOD OF THE CHINESE TEXTS CATEGORIZATION BASED ON FUZZY CLUSTERING[J].Computer Applications and Software,2003,20(10):49-50,61.
Authors:Lu Zhongliang  Wang Jiayun Rong Rong Zhu Jinsong Sun Jixiang
Affiliation:Lu Zhongliang 1,2 Wang Jiayun2 Rong Rong2 Zhu Jinsong2 Sun Jixiang1 1
Abstract:It's still difficult to classify quickly a great deal of different Chinese texts and to find efficiently the useful information.This very paper has set forth a method of the Chinese texts categorization and has solved the above problem preferably on real time.On account of the uniqueness of the Chinese texts,word-segmenting and space-reducing are done preliminarily to the training texts which,can always be classified into different classes.There by,we have here adopted the FCMdd algorithm.The experimental results have been proved to be efficient,and we can thus classify the texts quickly.
Keywords:Fuzzy clustering  Multi-classification  Word segmentation  Space reduction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号