首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于k-近邻的协同过滤推荐算法对于邻居数量k的确定过于主观,并且推荐时以k-近邻均值加权推荐不够准确.针对这两个问题,本文首先引入并改进最大最小距离聚类算法,进而设计启发式聚类模型将用户进行不规定类别数的自由聚类划分,目标用户所在类的用户为邻居用户,客观确定邻居数量;然后在推荐时定义类别相似度,针对性地建立目标用户未评分和评分项目的潜在类别关系,改进k-近邻均值加权算法.实验结果表明,该算法提高了推荐准确度(约0.035MAE).  相似文献   

2.
针对用户兴趣偏好多变问题,提出一种兴趣特征权重随时间而变化的迭代计算方法。构造了用户兴趣特征与主题类间的二部图关系,并在此基础上提出了一种基于主题的用户兴趣聚类算法(TBC),改变了聚类对象"非此即彼"的硬划分方式。该算法所形成的基于主题的用户兴趣域结构,不仅充分表达了用户的多域兴趣特征和域间主题的联系,还能适应用户兴趣变化。实验表明,TBC算法比传统的K-Means算法以及属于软划分方式的FCM聚类具有更好的用户兴趣划分效果,并且在个性化推荐服务中表现出更高的推荐质量和效率。  相似文献   

3.
用户兴趣空间的Web页面聚类   总被引:5,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

4.
范虹  张程程  侯存存  朱艳春  姚若侠 《电子学报》2019,47(10):2149-2157
针对乳腺MR图像组织复杂、灰度不均匀、难分割的特点,本文提出双树复小波(DTCWT)变换结合密度聚类的图像分割方法.首先利用复小波域双变量模型结合各向异性扩散函数对图像进行去噪处理;进而通过简单线性迭代聚类(SLIC)算法将图像划分成一定数量的超像素区域,根据事先设置的阈值搜索每个超像素的近邻,从而降低基于K近邻的密度峰值快速搜索聚类(KNN-DPC)算法寻找每个样本近邻的时间;最终,引入超像素区域的近邻信息度量样本密度,采用KNN-DPC算法的分配策略自适应聚类.仿真和临床数据分割结果表明,所提算法能有效的实现乳腺MR图像的分割.  相似文献   

5.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

6.
赵嘉  王刚  吕莉  樊棠怀 《电子学报》2022,(11):2730-2737
密度峰值聚类算法倾向在球形分布数据中选择密度峰值,而流形数据多呈非球形分布,导致不能准确找到数据的类簇中心.该算法的分配策略优先对类簇中心附近的样本进行链式分配,而流形数据大量样本远离其类簇中心,导致本应属于同一类簇的样本被错误分配.为此,本文提出一种面向流形数据的测地距离与余弦互逆近邻密度峰值聚类算法.将K近邻与测地距离结合并重新定义局部密度,凸显密度峰值与非密度峰值的差异,准确找到类簇中心;将互逆近邻和余弦相似性相结合,得到基于余弦互逆近邻的样本相似度矩阵,为流形类簇准确分配样本.实验结果表明,本算法能有效发现流形数据集的几何形状并准确聚类,对真实数据集和图像数据集的聚类效果优秀.  相似文献   

7.
文章提出了一种基于ISODATA的用户访问路径聚类算法,根据用户的访问兴趣定义了相似性测量手段和聚类中心。在对Web站点的访问日志进行事务识别后,根据群体用户对Web站点的访问顺序进行聚类,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。  相似文献   

8.
基于兴趣度的Web用户聚类方法   总被引:1,自引:1,他引:0  
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果.  相似文献   

9.
为了减小位置指纹定位算法的计算量,提出一种基于K均值聚类分析的位置指纹定位算法。通过对指纹数据库进行K聚类分析,形成聚类索引,定位时通过查询聚类索引来缩小指纹库查询空间。利用改进后的算法进行室内定位实验,并将其与K近邻法进行对比测试。实验结果表明,改进后的定位算法有效减小了定位过程的计算量,而且还能保证定位精度,在短距离范围内定位平均误差可限制在2m以内。  相似文献   

10.
针对传统K—Means聚类算法需要用户输入聚类数目的缺点,对K—Means聚类算法进行了改进,提出使用一个有效指数来克服这个问题,该算法不需要背景知识,自动聚类,提高了聚类的准确性。该算法还可以根据数据量的大小确定合适的步长,增强了适应性。通过将该算法应用于网站日志数据中对用户进行聚类,验证了算法的有效性。  相似文献   

11.
在采用分簇结构的GSM-R应急自组织网络中,簇头的选择将直接影响整个网络的性能,因此必须设计合理的分簇算法,综合考虑网络环境中的各种因素,使得形成的分簇结构具有很好的系统环境和应用需求的适应性。通过对Ad Hoc自组网中的加权分簇算法WCA(Weighted Clustering Algorithm)简单介绍,从算法的复杂度、负载均衡性和适用环境等方面对其性能进行比较和分析。本文改进一种基于组合加权思想的分簇算法,即基于簇稳定性的加权分簇算法,以下简称CSBWCA(Cluster-Stability Based Weighted Clustering Algorithm)。同时,介绍了此算法的设计思想,并仿真了加权分簇算法和基于稳定性的加权分簇算法的节点簇间转移次数R随GSM-R应急网络中参与应急通信的终端数目N和最大转移速度的变化情况以及两种分簇算法的簇头更新次数U随终端数目以及终端最大移动速度的变化情况。仿真结果表明,基于簇稳定性的加权分簇算法的性能明显优于加权分簇算法。  相似文献   

12.
用于高斯混合模型参数估计的EM算法及其初始化研究   总被引:2,自引:0,他引:2  
肖维 《电子测试》2011,(6):26-30
基于有限混合模型的聚类是一种重要的聚类分析方法,而EM算法是混合模型参数估计的重要方法.传统的EM算法对初始聚类中心比较敏感,因此如何选取初始值成为运用EM算法实现高斯混合模型聚类中的一个重要问题.本文提出一种基于网格的聚类算法来初始化EM算法,旨在改善EM算法的初始敏感性,使其达到更佳的聚类效果.此算法根据网格单元密...  相似文献   

13.
高光谱图像聚类问题一直是图像处理领域的研究热点。谱聚类算法是最流行的聚类算法之一,但其计算复杂度较大,难以处理大规模的高光谱图像数据。由于二叉树能够较快地选取锚点,因此基于二叉树锚点图,充分利用高光谱图像的光谱和空间特性,可保证聚类性能并降低计算复杂度。然而,该聚类算法一般采用有核的聚类方法,因此不可避免地引入了参数调节。在二叉树锚点选取的基础上,提出了一种基于二叉树锚点的高光谱快速聚类算法,该算法创新性地将二叉树锚点选取和无核聚类方法应用于高光谱图像中。首先,利用二叉树从高光谱数据中选取一些具有代表性的锚点;紧接着构造基于锚点的无核相似图,有效避免了通过人为调节热核参数来构造相似图;然后进行谱聚类分析获得聚类结果;最后,将该算法应用到高光谱图像聚类中。该算法不仅提高了聚类速度,还减少了原有热核参数调节。实验结果表明,与传统的聚类算法相比,所提算法能够在较短的时间内获得更佳的聚类精度。  相似文献   

14.
周浩理  李太君  肖沙 《电视技术》2015,39(17):139-142
K-means算法是经典的基于划分的聚类算法,但该算法存在依赖于初始聚类中心、容易陷入局部最优解等缺点,针对这些缺点,本文提出了基于微正则退火K-means聚类算法,通过继承微正则退火算法的高效全局寻优特性,可以避免陷入局部最优解。实验结果表明,改进的算法能够有效的减少原算法对初始聚类中心点的依赖,提高算法的稳定性,摆脱原算法容易陷入局部最优解的缺点。  相似文献   

15.
提出一种新的图聚类算法,结合结点的结构及属性特性,使用统一的随机移动距离计算结点间的相似度,在邻接随机移动距离矩阵的基础上进行聚类.实验结果表明,基于属性扩展图的聚类算法在图拓扑结构的基础上,充分考虑了各个结点所拥有的属性特点,得到的聚类结果将更好的切合实际的应用.  相似文献   

16.
为提高数据挖掘算法的挖掘速度,同时提高其精准度,提出基于电力营销聚类分析数据挖掘算法研究。首先运用聚类算法筛选数据,再计算数据结构和相异度矩阵相异度,得出最接近的类距离。完成上述步骤后,在聚类分析框架下,设计聚类分析数据挖掘算法流程。先输入数据,再设计数据挖掘算法基本策略,最后提出SLIO算法处理离散字段,得到有价值的数据信息。由此,完成基于电力营销聚类分析的数据挖掘算法设计。实验结果表明,与基于支持度-置信度-提升度的配网自动化系统数据挖掘算法和基于神经网络和粒子群优化的数据挖掘算法相比,文中基于电力营销聚类分析的数据挖掘算法的挖掘速度稳定,挖掘效果更好。同时测试精准度较高,可有效提高数据挖掘的可信度。  相似文献   

17.
张乾君 《电讯技术》2019,59(2):145-150
针对多雷达数据融合问题,提出了基于时间序列的聚类算法,用于实现航迹相关,即以时间序列为基础把聚类模型转化为基于特征匹配的聚类算法。进一步考虑到多目标密集时,部分来自不同目标的数据可能比来自同一目标的数据更接近,易导致关联错误,为此提出了基于时间序列的模糊聚类算法。对上述两种算法的聚类结果,应用卡尔曼滤波器实现滤波跟踪,在不同的情况下仿真后发现,在跟踪目标较少且相互位置较远的情况下,两种算法均有效,在跟踪目标较多且相互位置靠近的情况下,基于时间序列的模糊聚类算法更有效。  相似文献   

18.
未知雷达辐射源信号识别一直是雷达对抗情报分析中的难题。针对基于密度的聚类算法在处理不均匀样本时识别率较低的缺陷,将该算法与亲和传递(AP)聚类算法结合,提出一种基于AP密度聚类的识别方法。该方法先利用AP聚类方法对数据样本进行初步聚类,再设定相关参数,运用基于密度的带有噪声的空间聚类(DBSCAN)算法进行二次聚类。相对于原样本,初始聚类结果分布具有一定的代表性,容易找到适合DBSCAN方法的参数值。测试表明该方法具有较高的识别率。  相似文献   

19.
支晓斌  范九伦 《电子学报》2011,39(6):1358-1363
指出皋军等人提出的基于模糊最大散度差判别准则(Fuzzy Maximum Scatter Difference Discriminant Criterion,FMSDC)的聚类算法(Fuzzy Maximum Scatter Difference Diseriminant Criterion Based Cluster...  相似文献   

20.
现有医学图像生成过程中无法回避噪声的引入,而目前还未有较好的算法对高噪声的MRI医学图像进行分割,分割归属于聚类问题,聚类常用的方法是模糊聚类,但模糊聚类需要解决对噪声和初始化敏感的问题,提出了一种基于模糊熵聚类和粒子群优化算法的MRI脑图像分割算法.首先在模糊熵聚类算法的基础上进行改进,设计了 一种利用邻域空间信息的...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号