首页 | 本学科首页   官方微博 | 高级检索  
     

基于Chameleon算法的文本聚类技术研究
引用本文:黄文江,李翔,林祥. 基于Chameleon算法的文本聚类技术研究[J]. 计算机技术与发展, 2010, 20(6): 1-4,8
作者姓名:黄文江  李翔  林祥
作者单位:上海交通大学,信息安全工程学院,上海,200240
基金项目:国家自然科学基金,教育部新世纪优秀人才支持计划项目,上海市科学技术委员会科技攻关项目,上海市曙光计划 
摘    要:文本聚类是聚类的一个重要的研究方向,是聚类在文本处理领域的重要应用.但是,传统的聚类算法在文本聚类应用中的表现并不能让人满意.文中将一种新的聚类算法--Chameleon算法引入中文文本聚类领域中.在构建中文文本聚类模型的基础上结合了分词、文本向量化等技术进行了相关实验.实验的结果表明Chameleon算法可以应用在中文文本聚类领域中,同时也解决了传统算法在聚类形状发现方面的不足.相关实验说明了这种算法在中文文本聚类领域应用中的有效性和实用性.

关 键 词:文本聚类  文本向量

Research on Text Clustering Based on Chameleon Algorithm
HUANG Wen-jiang,LI Xiang,LIN Xiang. Research on Text Clustering Based on Chameleon Algorithm[J]. Computer Technology and Development, 2010, 20(6): 1-4,8
Authors:HUANG Wen-jiang  LI Xiang  LIN Xiang
Abstract:
Keywords:Chameleon
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号