基于频繁词序列的层次文本聚类算法研究 |
| |
引用本文: | 马文超,张建国,胡冰.基于频繁词序列的层次文本聚类算法研究[J].计算机时代,2009(4). |
| |
作者姓名: | 马文超 张建国 胡冰 |
| |
作者单位: | 1. 河南大学计算机与信息工程学院,河南,开封,475001 2. 中共漯河市委党校 |
| |
摘 要: | 提出一种基于频繁词序列的层次文本聚类算法,该算法考虑频繁词的次序关系和频繁词序列的文本频繁的重要性,构造了一种更合理的层次关系。实验证明,基于频繁词序列的层次文本聚类算法能够提高文本聚类的精确度。
|
关 键 词: | 文本聚类 频繁词序列 层次结构 类描述 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|