首页 | 本学科首页   官方微博 | 高级检索  
     

融合词项关联关系的半监督微博聚类算法
引用本文:马慧芳,贾美惠子,袁媛,张志昌.融合词项关联关系的半监督微博聚类算法[J].计算机工程,2015(5).
作者姓名:马慧芳  贾美惠子  袁媛  张志昌
作者单位:西北师范大学计算机科学与工程学院,兰州,730070
基金项目:国家自然科学基金资助项目,甘肃省教育厅基金资助项目(2013A-016)。
摘    要:针对微博文本内容短、稀疏、高维等特点,提出一种改进的半监督微博聚类算法。该算法利用词项间的关系丰富文本特征,通过定义词项文档间关联关系和词项文档内关联关系揭示词项间语义的关联程度,并由此自动生成有标记的数据来指导聚类过程。对词项先验信息进行成对约束编码,构建基于词项间成对约束的三重非负矩阵分解模型来实现微博的半监督聚类。实验结果表明,该算法可以减少繁琐的人工标记过程,并能高效地进行微博聚类。

关 键 词:微博  词项关联关系  成对约束  半监督聚类  非负矩阵分解

Semi-supervised Microblog Clustering Algorithm Fused with Term Correlation Relationship
MA Huifang,JIA Meihuizi,YUAN Yuan,ZHANG Zhichang.Semi-supervised Microblog Clustering Algorithm Fused with Term Correlation Relationship[J].Computer Engineering,2015(5).
Authors:MA Huifang  JIA Meihuizi  YUAN Yuan  ZHANG Zhichang
Abstract:
Keywords:microblog  term correlation relationship  pair-wise constraints  semi-supervised clustering  non-negative matrix factorization
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号