首页 | 本学科首页   官方微博 | 高级检索  
     

特征加权距离与软子空间学习相结合的文本聚类新方法
引用本文:王骏,王士同,邓赵红.特征加权距离与软子空间学习相结合的文本聚类新方法[J].计算机学报,2012,35(8):1655-1665.
作者姓名:王骏  王士同  邓赵红
作者单位:江南大学数字媒体学院 江苏无锡214122
基金项目:国家自然科学基金,江苏省自然科学基金,江苏“333高层次人才培养工程”,中央高校基本科研业务专项资金项目
摘    要:文本数据维数高、数据分布稀疏、不同类别的特征相互重叠,这为聚类分析提出了挑战.针对文本数据的这一特点,将特征加权技术与软子空间相结合,基于模糊聚类的算法框架,提出了一种适用于高维文本数据的软子空间模糊聚类新方法.首先,基于加权范数理论,提出了新的特征加权距离计算方法.接着,将其与软子空间学习的理论框架相结合,提出了面向模糊聚类的新的目标学习准则.通过向约束条件中引入熵指数r,从而扩展了模糊指数m的取值范围,并给出了物理解释.基于Zangwill收敛定理对算法的全局收敛性给出理论证明.实验表明,文中算法可以使软子空间学习和聚类分析同时进行,其性能比现有的相关算法有了较大的提高.

关 键 词:模糊聚类  文本聚类  软子空间  特征加权距离  全局收敛性

A Novel Text Clustering Algorithm Based on Feature Weighting Distance and Soft Subspace Learning
WANG Jun , WANG Shi-Tong , DENG Zhao-Hong.A Novel Text Clustering Algorithm Based on Feature Weighting Distance and Soft Subspace Learning[J].Chinese Journal of Computers,2012,35(8):1655-1665.
Authors:WANG Jun  WANG Shi-Tong  DENG Zhao-Hong
Affiliation:(School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号