首页 | 本学科首页   官方微博 | 高级检索  
     

海量中文短信文本最佳聚类数研究
引用本文:刘金岭.海量中文短信文本最佳聚类数研究[J].计算机工程,2010,36(8):66-68.
作者姓名:刘金岭
作者单位:淮阴工学院计算机系,淮安,223003
基金项目:国家自然科学基金资助项目(60632050);;江苏省高校自然科学基金资助项目(06KJD520024)
摘    要:针对海量中文短信文本的聚类簇数的确定问题,提出一种基于聚类过程的短信文本最佳聚类数确定方法。通过扫描一遍数据即可获得多个统计信息,利用增量逐层划分得到最优划分所对应的簇类数,求出最优解。实验结果表明,与其他方法相比,该方法的分类效率较高。

关 键 词:聚类  簇数  增量  划分
修稿时间: 

Study on Optimal Clustering Number in Mass Chinese Short Message Text
LIU Jin-ling.Study on Optimal Clustering Number in Mass Chinese Short Message Text[J].Computer Engineering,2010,36(8):66-68.
Authors:LIU Jin-ling
Affiliation:Department of Computer/a>;Huaiyin Institute of Technology/a>;Huai'an 223003
Abstract:According to the characteristics of Chinese short message text, this paper presents a clustering process based on algorithms of the optimal number, which can be obtained multiple statistical information by scaning the data only once, and using increment in-depth profile analysis so as to obtain corresponding total number of class cluster, obtained optimal solution. Experimental result shows that the method has advantage with highly-quality than other methods.
Keywords:clustering  cluster number  increment  division
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号