首页 | 本学科首页   官方微博 | 高级检索  
     

模糊聚类算法在汉语文本聚类中的应用
引用本文:李家福,张亚非,陆建江.模糊聚类算法在汉语文本聚类中的应用[J].计算机工程,2002,28(4):15-16,33.
作者姓名:李家福  张亚非  陆建江
作者单位:1. 解放军理工大学通信工程学院,南京,210016
2. 解放军理工大学理学院,南京,210016
基金项目:国家自然科学基金项目(69975024),国家自然科学基金重点项目(69931040)
摘    要:应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。

关 键 词:汉语文本聚类  模糊聚类算法  汉字信息处理  计算机  模糊C-原型算法
文章编号:1000-3428(2002)04-0015-02

Application of Fuzzy Clustering Algorithm in Chinese Document Clustering
LI Jiafu,ZHANG Yafei,LU Jianjiang.Application of Fuzzy Clustering Algorithm in Chinese Document Clustering[J].Computer Engineering,2002,28(4):15-16,33.
Authors:LI Jiafu  ZHANG Yafei  LU Jianjiang
Abstract:This paper uses a new algorithm of segmentating Chinese document, which doesn't rely on a lexicon, grammar, word-formation heuristics or pre-segmented data. Then it applies FCA (Fuzzy Clustering Algorithm) to Chinese document clustering. FCA is superior to other ordinary clustering algorithm and the result can embody the wide diversity and large amount of Chinese document.
Keywords:Document cluster  Word segmentation  Fuzzy c-archetype algorithm  Non-Euclidean relational data  CompetitiveaggIomeration aIgorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号