基于成对约束的主动半监督文本聚类 |
| |
作者姓名: | 钟将 刘龙海 梁传伟 |
| |
作者单位: | 1. 重庆大学计算机学院,重庆,400044 2. 山东省莱州市国家税务局信息中心,山东,莱州,261400 |
| |
基金项目: | 国家科技支撑计划基金资助重大项目,重庆市自然科学基金资助项目,"211工程"三期建设基金资助项目 |
| |
摘 要: | 在主动选取成对约束方法的基础上,提出一种基于成对约束的主动半监督文本聚类方法.利用潜在语义索引方法对文本特征空间进行降维,在聚类过程中,采用构造的约束选取方法主动地选取成对约束信息,并利用选取的成对约束信息指导文本聚类.实验结果表明,该方法能利用少量的监督信息提高文本聚类的分类准确率.
|
关 键 词: | 文本聚类 半监督聚类 潜在语义索引 成对约束 |
收稿时间: | 2010-12-24 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程》浏览原始摘要信息 |
|
点击此处可从《计算机工程》下载全文 |
|