期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

任家东周玮玮何海涛《计算机科学与探索》2010,4(9):859-864

高维数据流聚类是数据挖掘领域中的研究热点。由于数据流具有数据量大、快速变化、高维性等特点,许多聚类算法不能取得较好的聚类质量。提出了高维数据流的自适应子空间聚类算法SAStream。该算法改进了HPStream中的微簇结构并定义了候选簇,只在相应的子空间内计算新来数据点到候选簇质心的距离,减少了聚类时被检查微簇的数目,将形成的微簇存储在金字塔时间框架中,使用时间衰减函数删除过期的微簇;当数据流量大时,根据监测的系统资源使用情况自动调整界限半径和簇选择因子,从而调节聚类的粒度。实验结果表明,该算法具有良好的聚类质量和快速的数据处理能力。相似文献

2.

图像搜索结果的重叠层次聚类与代表点展现

谷瑞军陈圣磊陈耿汪加才《计算机应用》2012,32(4):1097-1100

针对图像聚类中面临的高维、准确度低、部分重叠等问题,提出了一种高效的基于链接层次聚类的多标记图像聚类。该方法通过图像距离计算相似度,通过链接聚类检测重叠簇。从而每个图像可能归属于多个簇,使得簇标签的意义更明确。为了检验方法的有效性,对通过搜索引擎检索特定关键词返回的图片数据集进行聚类。结果表明,该方法能有效发现具有重叠划分的簇,且簇的意义比较明确。相似文献

3.

基于高斯分布的簇间距离计算方法 总被引：2，自引：0，他引：2

季铎王智超蔡东风张桂平《中文信息学报》2008,22(3):50-55

凝聚的层次聚类算法是一种性能优越的聚类算法,该算法通过不断合并距离相近的簇最终将数据集合划分为用户指定的若干个类别。在聚类的过程中簇间距离计算的准确性是影响算法性能的重要因素。本文提出一种新的基于高斯分布的簇间距离的计算方法,该方法通过簇自身的大小、密度分布等因素改进算法的计算准确性,在不同文本集合上与现有的簇间距离计算方法进行了对比实验,实验结果表明该方法有效地改进了层次聚类算法的性能。相似文献

4.

一种基于内容特性的文本聚类方法

下载免费PDF全文

李晓光宋宝燕于戈王大玲《计算机工程》2007,33(14):24-26,32

在基于概率模型的聚类中，簇模型对数据分布的拟合性直接影响着聚类质量。基于内容的文本数据分布的复杂性导致单一因素的簇模型无法准确拟合文本数据的分布特征。该文认为文本基于内容的分布特性主要受主题内容和通用写作方式影响，给出了一种基于主题模型和通用模型的混合簇模型和基于该簇模型的文本聚类方法。实验表明该聚类方法较单一因素的簇模型具有更好的拟合性，聚类质量更好。相似文献

5.

基于混合度量与类簇自适应调整的粗糙模糊K-means聚类算法

张鑫涛马福民曹杰张腾飞《模式识别与人工智能》2019,32(12):1141-1150

针对粗糙K-means聚类及其相关衍生算法需要提前人为给定聚类数目、随机选取初始类簇中心导致类簇交叉区域的数据划分准确率偏低等问题,文中提出基于混合度量与类簇自适应调整的粗糙模糊K-means聚类算法.在计算边界区域的数据对象归属于不同类簇的隶属程度时,综合考虑局部密度和距离的混合度量,并采用自适应调整类簇数目的策略,获得最佳聚类数目.选取数据对象稠密区域中距离最小的两个样本的中点作为初始类簇中心,将附近局部密度高于平均密度的对象划分至该簇后再选取剩余的初始类簇中心,使初始类簇中心的选取更合理.在人工数据集和UCI标准数据集上的实验表明,文中算法在处理类簇交叠严重的球簇状数据集时,具有自适应性,聚类精度较优. 相似文献

6.

一种利用代表点的有效聚类算法设计与实现 总被引：1，自引：0，他引：1

陈恩红王上飞宁岩王煦法《模式识别与人工智能》2001,14(4)

本文针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,设计了一种有效的聚类算法.该方法首先从聚类簇中选取充分分散的若干数据点,然后将它们向聚类簇的重心收缩,依此得到的多个数据点作为聚类簇的代表.通过选取多个代表点,本算法可以捕捉到不同形状的聚类簇的几何特征,且受离群数据的影响较小.实验结果表明,该算法处理复杂数据是有效的. 相似文献

7.

基于社会标注系统的Web用户聚类算法

卢露赵靖魏登月《计算机应用研究》2013,30(12):3557-3559

针对Web用户聚类时, 社会标注系统中用户访问资源数据稀疏从而导致传统聚类算法效率不高的问题, 提出了一种三向迭代聚类算法, 对用户、标签和资源分别聚类, 利用三者之间的关联关系不断相互交叉迭代调整, 直到各聚类簇达到稳定为止。实验表明, 该方法调整后类的内聚性更强, 区分度更大, 能有效解决数据稀疏性问题, 提高用户聚类效果。相似文献

8.

双向聚类迭代的协同过滤推荐算法 总被引：1，自引：1，他引：0

王明文陶红亮熊小勇《中文信息学报》2008,22(4):61

协同过滤是电子商务推荐系统中广泛采用的技术,然而数据稀疏性会影响协同过滤的推荐质量。针对数据稀疏问题提出一种双向聚类迭代的协同过滤推荐算法,对初始得到的用户聚类和项目聚类进行交叉迭代调整,使得聚类簇达到较为稳定的状态。调整后聚类簇的内聚性更强,类之间的区分度更大。实验表明,在调整后的聚类簇中查找邻居将更加准确,可以有效解决数据稀疏问题的影响,有利于提高推荐的准确性。相似文献

9.

一种改进的加权复杂网络聚类方法

郭陶张琨郭文娟庄克琛贺定龙李配配《计算机科学》2012,39(109):99-102

在复杂网络聚类中,为了克服聚类结果局部收敛和对多维数据聚类效果差的缺点,通过对复杂网络聚类方法的应用分析,将NJ W算法和粒子群聚类算法应用到加权复杂网络簇结构的探测中,设计和实现了一种改进的加权复杂网络聚类方法。实验验证了该方法在簇结构较复杂的网络中具有较高的执行效率和较好的执行效果。相似文献

10.

基于模糊逻辑的K-means算法研究

陈苏蓉朱晓辉《计算机工程与科学》2012,34(12):155-159

K-means算法的基本思想是通过迭代方法把所有的元素都唯一聚类到不同的簇中,使得同一簇中的质点具有最小相异度,不同簇间的元素具有最大相异度。但是,这种聚类方法使得那些属于不同簇的交叉区域中的质点也被简单地聚类到了某个簇中,因此无法表达某些元素的跨簇特性。本文提出了基于模糊逻辑的K-means算法,利用模糊逻辑来计算不同簇交叉区域中质点属于某个簇的权重,在获得聚类结果的同时可以有效描述质点的跨簇特性。实验结果表明该算法是有效的。相似文献