首页 | 本学科首页   官方微博 | 高级检索  
     

基于语义的高质量中文短信文本聚类算法
引用本文:刘金岭. 基于语义的高质量中文短信文本聚类算法[J]. 计算机工程, 2009, 35(10): 201-202
作者姓名:刘金岭
作者单位:淮阴工学院计算机工程系,淮安,223003
摘    要:现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想。针对中文短信文本聚类提出一种基于语义的聚类算法。给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文短信文本聚类。实验结果表明,该算法的聚类质量高于传统算法。

关 键 词:短信文本  语义  概念相似度
修稿时间: 

High Quality Algorithm for Chinese Short Messages Text Clustering Based on Semantic
LIU Jin-ling. High Quality Algorithm for Chinese Short Messages Text Clustering Based on Semantic[J]. Computer Engineering, 2009, 35(10): 201-202
Authors:LIU Jin-ling
Affiliation:Department of Computer;Huaiyin Institute of Technology;Huaian 223003
Abstract:Existing data clustering method lacks considering of latent similar information existing among words,and it leads to unsatisfactory clustering result.Aiming at Chinese short message text clustering,this paper proposes a clustering algorithm based on semantic.It offers Chinese concept,and the measuring methods to calculate the similarity degree about words and Chinese short message text.It completes the clustering of Chinese short messages text through fission downwards and mergence of twos upwards.Experimen...
Keywords:short messages text  semantic  concept similarity  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号