共查询到20条相似文献,搜索用时 93 毫秒
1.
基于k-近邻的协同过滤推荐算法对于邻居数量k的确定过于主观,并且推荐时以k-近邻均值加权推荐不够准确.针对这两个问题,本文首先引入并改进最大最小距离聚类算法,进而设计启发式聚类模型将用户进行不规定类别数的自由聚类划分,目标用户所在类的用户为邻居用户,客观确定邻居数量;然后在推荐时定义类别相似度,针对性地建立目标用户未评分和评分项目的潜在类别关系,改进k-近邻均值加权算法.实验结果表明,该算法提高了推荐准确度(约0.035MAE). 相似文献
2.
3.
用户兴趣空间的Web页面聚类 总被引:5,自引:1,他引:4
郭岩 《微电子学与计算机》2003,20(8):10-14,68
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。 相似文献
4.
针对乳腺MR图像组织复杂、灰度不均匀、难分割的特点,本文提出双树复小波(DTCWT)变换结合密度聚类的图像分割方法.首先利用复小波域双变量模型结合各向异性扩散函数对图像进行去噪处理;进而通过简单线性迭代聚类(SLIC)算法将图像划分成一定数量的超像素区域,根据事先设置的阈值搜索每个超像素的近邻,从而降低基于K近邻的密度峰值快速搜索聚类(KNN-DPC)算法寻找每个样本近邻的时间;最终,引入超像素区域的近邻信息度量样本密度,采用KNN-DPC算法的分配策略自适应聚类.仿真和临床数据分割结果表明,所提算法能有效的实现乳腺MR图像的分割. 相似文献
5.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。 相似文献
6.
密度峰值聚类算法倾向在球形分布数据中选择密度峰值,而流形数据多呈非球形分布,导致不能准确找到数据的类簇中心.该算法的分配策略优先对类簇中心附近的样本进行链式分配,而流形数据大量样本远离其类簇中心,导致本应属于同一类簇的样本被错误分配.为此,本文提出一种面向流形数据的测地距离与余弦互逆近邻密度峰值聚类算法.将K近邻与测地距离结合并重新定义局部密度,凸显密度峰值与非密度峰值的差异,准确找到类簇中心;将互逆近邻和余弦相似性相结合,得到基于余弦互逆近邻的样本相似度矩阵,为流形类簇准确分配样本.实验结果表明,本算法能有效发现流形数据集的几何形状并准确聚类,对真实数据集和图像数据集的聚类效果优秀. 相似文献
7.
文章提出了一种基于ISODATA的用户访问路径聚类算法,根据用户的访问兴趣定义了相似性测量手段和聚类中心。在对Web站点的访问日志进行事务识别后,根据群体用户对Web站点的访问顺序进行聚类,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。 相似文献
8.
基于兴趣度的Web用户聚类方法 总被引:1,自引:1,他引:0
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果. 相似文献
9.
10.
针对传统K—Means聚类算法需要用户输入聚类数目的缺点,对K—Means聚类算法进行了改进,提出使用一个有效指数来克服这个问题,该算法不需要背景知识,自动聚类,提高了聚类的准确性。该算法还可以根据数据量的大小确定合适的步长,增强了适应性。通过将该算法应用于网站日志数据中对用户进行聚类,验证了算法的有效性。 相似文献
11.
在采用分簇结构的GSM-R应急自组织网络中,簇头的选择将直接影响整个网络的性能,因此必须设计合理的分簇算法,综合考虑网络环境中的各种因素,使得形成的分簇结构具有很好的系统环境和应用需求的适应性。通过对Ad Hoc自组网中的加权分簇算法WCA(Weighted Clustering Algorithm)简单介绍,从算法的复杂度、负载均衡性和适用环境等方面对其性能进行比较和分析。本文改进一种基于组合加权思想的分簇算法,即基于簇稳定性的加权分簇算法,以下简称CSBWCA(Cluster-Stability Based Weighted Clustering Algorithm)。同时,介绍了此算法的设计思想,并仿真了加权分簇算法和基于稳定性的加权分簇算法的节点簇间转移次数R随GSM-R应急网络中参与应急通信的终端数目N和最大转移速度的变化情况以及两种分簇算法的簇头更新次数U随终端数目以及终端最大移动速度的变化情况。仿真结果表明,基于簇稳定性的加权分簇算法的性能明显优于加权分簇算法。 相似文献
12.
用于高斯混合模型参数估计的EM算法及其初始化研究 总被引:2,自引:0,他引:2
基于有限混合模型的聚类是一种重要的聚类分析方法,而EM算法是混合模型参数估计的重要方法.传统的EM算法对初始聚类中心比较敏感,因此如何选取初始值成为运用EM算法实现高斯混合模型聚类中的一个重要问题.本文提出一种基于网格的聚类算法来初始化EM算法,旨在改善EM算法的初始敏感性,使其达到更佳的聚类效果.此算法根据网格单元密... 相似文献
13.
高光谱图像聚类问题一直是图像处理领域的研究热点。谱聚类算法是最流行的聚类算法之一,但其计算复杂度较大,难以处理大规模的高光谱图像数据。由于二叉树能够较快地选取锚点,因此基于二叉树锚点图,充分利用高光谱图像的光谱和空间特性,可保证聚类性能并降低计算复杂度。然而,该聚类算法一般采用有核的聚类方法,因此不可避免地引入了参数调节。在二叉树锚点选取的基础上,提出了一种基于二叉树锚点的高光谱快速聚类算法,该算法创新性地将二叉树锚点选取和无核聚类方法应用于高光谱图像中。首先,利用二叉树从高光谱数据中选取一些具有代表性的锚点;紧接着构造基于锚点的无核相似图,有效避免了通过人为调节热核参数来构造相似图;然后进行谱聚类分析获得聚类结果;最后,将该算法应用到高光谱图像聚类中。该算法不仅提高了聚类速度,还减少了原有热核参数调节。实验结果表明,与传统的聚类算法相比,所提算法能够在较短的时间内获得更佳的聚类精度。 相似文献
14.
15.
提出一种新的图聚类算法,结合结点的结构及属性特性,使用统一的随机移动距离计算结点间的相似度,在邻接随机移动距离矩阵的基础上进行聚类.实验结果表明,基于属性扩展图的聚类算法在图拓扑结构的基础上,充分考虑了各个结点所拥有的属性特点,得到的聚类结果将更好的切合实际的应用. 相似文献
16.
为提高数据挖掘算法的挖掘速度,同时提高其精准度,提出基于电力营销聚类分析数据挖掘算法研究。首先运用聚类算法筛选数据,再计算数据结构和相异度矩阵相异度,得出最接近的类距离。完成上述步骤后,在聚类分析框架下,设计聚类分析数据挖掘算法流程。先输入数据,再设计数据挖掘算法基本策略,最后提出SLIO算法处理离散字段,得到有价值的数据信息。由此,完成基于电力营销聚类分析的数据挖掘算法设计。实验结果表明,与基于支持度-置信度-提升度的配网自动化系统数据挖掘算法和基于神经网络和粒子群优化的数据挖掘算法相比,文中基于电力营销聚类分析的数据挖掘算法的挖掘速度稳定,挖掘效果更好。同时测试精准度较高,可有效提高数据挖掘的可信度。 相似文献
17.
针对多雷达数据融合问题,提出了基于时间序列的聚类算法,用于实现航迹相关,即以时间序列为基础把聚类模型转化为基于特征匹配的聚类算法。进一步考虑到多目标密集时,部分来自不同目标的数据可能比来自同一目标的数据更接近,易导致关联错误,为此提出了基于时间序列的模糊聚类算法。对上述两种算法的聚类结果,应用卡尔曼滤波器实现滤波跟踪,在不同的情况下仿真后发现,在跟踪目标较少且相互位置较远的情况下,两种算法均有效,在跟踪目标较多且相互位置靠近的情况下,基于时间序列的模糊聚类算法更有效。 相似文献
18.
19.