首页 | 本学科首页   官方微博 | 高级检索  
     

基于成对约束的主动半监督文本聚类
引用本文:钟将,刘龙海,梁传伟.基于成对约束的主动半监督文本聚类[J].计算机工程,2011,37(13):183-186.
作者姓名:钟将  刘龙海  梁传伟
作者单位:1. 重庆大学计算机学院,重庆,400044
2. 山东省莱州市国家税务局信息中心,山东,莱州,261400
基金项目:国家科技支撑计划基金资助重大项目,重庆市自然科学基金资助项目,"211工程"三期建设基金资助项目
摘    要:在主动选取成对约束方法的基础上,提出一种基于成对约束的主动半监督文本聚类方法.利用潜在语义索引方法对文本特征空间进行降维,在聚类过程中,采用构造的约束选取方法主动地选取成对约束信息,并利用选取的成对约束信息指导文本聚类.实验结果表明,该方法能利用少量的监督信息提高文本聚类的分类准确率.

关 键 词:文本聚类  半监督聚类  潜在语义索引  成对约束
收稿时间:2010-12-24

Active Semi-supervised Text Clustering Based on Pairwise Constraints
ZHONG Jiang,LIU Long-hai,LIANG Chuan-wei.Active Semi-supervised Text Clustering Based on Pairwise Constraints[J].Computer Engineering,2011,37(13):183-186.
Authors:ZHONG Jiang  LIU Long-hai  LIANG Chuan-wei
Affiliation:1.College of Computer Science,Chongqing University,Chongqing 400044,China;2.National Taxation Bureau of Laizhou,Shandong Province,Laizhou 261400,China)
Abstract:An active method which can effectively select pairwise constraints is constructed.By using this method,an active semi-supervised text clustering method based on pairwise constraints is proposed.Latent Semantic Index(LSI) is used to reduce the dimension of text features.In the clustering process,it uses the proposed method to actively select pairwise constraints,and then uses these pairwise constraints to steer the clustering process towards an appropriate partition.Experimental results show that the proposed method can effectively improve the text clustering results by using a small amount of pairwise constraints
Keywords:text clustering  semi-supervised clustering  Latent Semantic Index(LSI)  pairwise constraints
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号