基于相对密度的多耦合文本聚类算法* |
| |
作者姓名: | 王洪佳 邢长征 王星 |
| |
作者单位: | 辽宁工程技术大学电子与信息工程学院,辽宁工程技术大学电子与信息工程学院,辽宁工程技术大学电子与信息工程学院 |
| |
基金项目: | 国家自然科学(61402212):语义Web模糊规则互换与推理关键技术研究 |
| |
摘 要: | 针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。该算法在基于相对密度的聚类方法基础上,根据相对密度越小本文相似性越小这一事实,将相对密度转化为文本相似度,融入了传统DBSCAN密度算法,并对核心对象的选取进行了优化,。实验结果表明,与改进的K-means文本聚类和改进的DBSCAN文本聚类算法相比,本算法在文本聚类中更高效、聚类质量更优。
|
关 键 词: | 文本聚类 空间向量模型 相对密度 文本相似度 核心对象 |
收稿时间: | 2015-02-03 |
修稿时间: | 2015-03-18 |
|
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|