首页 | 本学科首页   官方微博 | 高级检索  
     

使用“分裂-合并"策略改进文本聚类集成算法的研究
引用本文:卢志茂,徐森,刘远超,顾国昌.使用“分裂-合并"策略改进文本聚类集成算法的研究[J].高技术通讯,2010,20(7).
作者姓名:卢志茂  徐森  刘远超  顾国昌
作者单位:1. 哈尔滨工程大学模式识别与自然计算研究室,哈尔滨,150001
2. 盐城工学院计算机工程系,盐城,224051
3. 哈尔滨工业大学智能技术与自然语言处理实验室,哈尔滨,150001
基金项目:863计划,国家自然科学基金,高等学校博士学科点专项科研基金 
摘    要:探讨了"分裂-合并"(DM)策略对文本聚类集成算法改进的效果。首先在聚类成员生成阶段运行使用DM策略的超球K均值(SKM)算法r次,每次生成较多的文本子簇,并根据子簇的相似性使用凝聚层次聚类方法合并这些子簇,得到r个聚类成员,随后在聚类集成阶段采用两个快速的谱聚类算法进行集成。在6组真实文本集上进行了实验,使用DM策略的两个聚类集成算法获得的平均标准化互信息(NMI)分别比改进前的算法提高了4.6和7.9个百分点,证明了DM策略可以有效提高文本聚类集成算法的聚类质量。

关 键 词:聚类集成  谱聚类  文本聚类  分裂-合并(DM)  标准化互信息(NMI)

Improvement of document cluster ensemble algorithms using divide and merge strategy
Lu Zhimao,Xu Sen,Liu Yuanchao,Gu Guochang.Improvement of document cluster ensemble algorithms using divide and merge strategy[J].High Technology Letters,2010,20(7).
Authors:Lu Zhimao  Xu Sen  Liu Yuanchao  Gu Guochang
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号