一种改进的基于后缀树模型搜索结果聚类算法 |
| |
作者姓名: | 刘德山 |
| |
作者单位: | 辽宁师范大学计算机与信息技术学院 大连116081 |
| |
基金项目: | 辽宁省教育厅科研基金(2008366)资助 |
| |
摘 要: | 针对现有搜索结果分类算法在聚类标签筛选、聚类质量评估及控制重叠聚类方面的缺陷,提出了一种改进的基于向量空间模型与后缀树模型的检索结果聚类算法,从而完善了LINGO算法的聚类及聚类标签打分函数,增加了基本类合并过程,改善了对中文的处理效果。最后对算法的分类效果及产生标签的质量进了实验分析,基于carrot2框架,建立了Wcb搜索结果聚类推荐平台。验证了CQIG算法分类的准确性和聚类标签的区分性和可读性。
|
关 键 词: | 搜索结果聚类 后缀树模型 向量空间模型 奇异值分解 |
本文献已被 CNKI 万方数据 等数据库收录! |
|