首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 812 毫秒
1.
协同过滤算法可根据用户的偏好,预测其感兴趣的项目,这项技术是目前商业领域中应用较为广泛且成功的。过去,使用协同过滤算法会因其数据的稀疏性及使用K-Means算法聚类时需要预先确定聚类个数等问题影响协同过滤算法的准确性。针对上述问题,提出了一种多聚类融合的协同过滤推荐算法。首先,构建用户-项目评分矩阵;其次,根据用户兴趣、偏好矩阵查找待估值项所对应的近邻用户,随后使用Slope One算法在对每一个簇内的稀疏矩阵进行填充,从而缓解数据稀疏性问题;再次,使用Canopy聚类算法进行粗聚类,将计算出的每个中心点作为K-Means算法的初始聚类点并进行K-Means细聚类;最后,优化后的协同过滤算法最终被用来预测每个簇中填充后的评分矩阵,并采用带时间加权的相似度公式。最终实验数据显示,优化后能够有效提升算法的效率与推荐质量。  相似文献   

2.
针对二分K-均值算法由于随机选取初始中心及人为定义聚类数而造成的聚类结果不稳定问题,提出了基于密度和中心指标的Canopy二分K-均值算法SDC_Bisecting K-Means。首先计算样本中数据密度及其邻域半径;然后选出密度最小的数据并结合Canopy算法的思想进行聚类,将得到的簇的个数及其中心作为二分K-均值算法的输入参数;最后在二分K-均值算法的基础上引入指数函数和中心指标对原始样本进行聚类。利用UCI数据集和自建数据集进行模拟实验对比,结果表明SDC_Bisecting K-Means不仅使得聚类结果更精确,同时算法的运行速度更快、稳定性更好。  相似文献   

3.
程江洲  何艳  鲍刚  潘飞 《计算机仿真》2021,38(7):63-67,133
针对传统K-means算法存在的对初始聚类中心敏感和需要预先给定K值的问题,提出了一种基于CK-means算法的用户用电负荷聚类分析方法.先对负荷数据进行预处理,通过密度Canopy算法可得到最优簇集值K与最佳初始聚类中心,将其代入K-means算法中可提取出典型的用户负荷模式、得到具有差异性的聚类成员,选取江西某地216名用户一个月的负荷数据进行实例仿真,通过与两种典型的聚类方法进行比较,并用不同的有效性指标来评价其聚类性能,实验结果证明改进后的新算法在准确性、稳定性和有效性方面都优于其它算法.  相似文献   

4.
为提高错峰管理中用户负荷模式识别的可靠性与普适性,针对目前单一聚类算法难以解决用电负荷数据的不平衡性以及时序特性等问题,提出一种基于聚类集成技术的用户负荷模型识别方案。利用多种标准化方法以及经遴选的聚类算法生成多样化的聚类成员,通过将所有聚类成员合并构造共识矩阵并进行重构,得到较单一聚类算法更为优越的分群结果。该方案比采用单一的聚类分析得到的用户用电负荷数据分簇结果更稳健可靠,且对数据结构变化的敏感度低、分簇效果更好、泛化能力更强,并在中山市6 500家专变用户的用电负荷模式识别中取得了良好的应用效果。  相似文献   

5.
论文以某智能小区的一户居民用户电力负荷数据为研究对象,利用K均值聚类算法提取该用户不同日类型下的负荷特征曲线,分析其用电行为,为客户用电精细化管理提供依据.首先根据用户档案采集和整理的用电数据,采用向前向后移动平均法和归一化方法对数据集进行数据清洗和标准化预处理;然后,采用轮廓图法和平均轮廓值法确定初始聚类数;最后,利用K均值聚类算法对该用户用电负荷提取节假日以及不同季节的负荷特征曲线,结合家用电器使用负荷热力图,分析该用户用电行为特征.算例分析结果表明,采用K均值聚类算法可以明显区分用户负荷曲线的特征,实现用户用电行为的分析,为客户用电的精细化管理、提供优质的用电服务等提供支持.  相似文献   

6.
随着我国经济实力的不断提高,窃电的方法越来越多样化,而且隐蔽性更强。提出了一种主要用于监测与辨识用户是否存在窃电行为的智能算法。该算法需要建立在用户用电负荷和用电参量特征的基础上。首先,收集用户的用电负荷相关数据,进行数据预处理。其次,使用聚类算法通过确定最佳聚类数来分析用户的用电数据,从而计算确定聚类数据的中心线。最后,依据用户负荷曲线与各聚类中心线的隶属度,确定用户用电数据所属的数据特征曲线,并对用户的用电数据与类别曲线作出匹配和筛选,确定疑似有窃电行为的用户。实际测试结果表明,窃电检测模型通过相关系数和欧几里得距离相结合的相似性度量,能更加有效地检测用户窃电行为。在后续的研究中,可以考虑增加按照用户的类型和季节变化进行用电负荷的分类,从而更好地提高检测的有效性。  相似文献   

7.
张宇  邵良衫  邱云飞  刘威 《计算机工程》2011,37(15):40-42,45
K-Means算法的聚类结果对初始簇的选择非常敏感,通常获得的是局部最优解而非全局最优解.为此,在K-Means聚类算法基础上,引入组合聚类和竞争学习概念,提出一种基于竞争学习的K质心组合聚类算法CLK-Centroid.该算法采用竞争学习策略计算簇的质心,以适应噪声数据和分布异常数据的要求,使用组合聚类策略提高聚类的...  相似文献   

8.
针对在零知识下识别比特流未知协议这一问题,提出了一种协议分类模型。该模型首先利用二进制流的固有特性来计算协议种类个数近似值K和初始聚类中心,然后使用改进的K-Means聚类算法指定K及初始聚类中心以进行聚类,最后使用基于信息熵的混杂度评价方法对聚类结果进行评价,可将评价结果较好的类簇作为一种协议类型进行标记,用于其他分析。使用林肯实验室发布的实验数据进行测试,结果表明该模型能以较高的准确率对未知协议进行分类,基于信息熵的类簇评价方法也具有一定实用性。  相似文献   

9.
针对聚类中的特征选择问题,提出一种基于特征语义权重的数据聚类方法。该方法由用户指定必需的特征集,通过计算特征之间的语义相关度,选择和指定特征集相关的特征集作为补充。利用语义相关度确定各个特征的语义权重,在特征语义权重计算的基础上对传统的K-Means聚类算法进行改进,提出具有特征语义权重的FSW-KMeans算法。实验结果表明,FSW-KMeans算法较大地提高了聚类算法准确率和效率。  相似文献   

10.
针对电力公司海量数据分类问题,提出一种改进的k-means数据分类方法。在k-means算法的基础上,应用PCA对k-means算法进行降维处理,用canopy算法优化最佳簇集数、初始聚类中心。然后,应用改进的k-means算法对居民用户用电进行聚类;最后以该聚类结果为基础,建立LSTM预测模型。通过LSTM预测模型对某小区90户居民用电数据进行仿真实验,并对比分析了传统聚类、改进聚类和不适用聚类下LSTM三种模型的预测结果。结果表明,未使用任何聚类算法构建的LSTM模型在进行电力负荷预测时,预测结果的精度最低;应用改进的k-means算法构建的LSTM模型预测结果精度最佳。  相似文献   

11.
基于Seed集的半监督核聚类   总被引:2,自引:1,他引:1       下载免费PDF全文
提出了一种新的半监督核聚类算法——SKK-均值算法。算法利用一定数量的标记样本构成seed集,作为监督信息来初始化K-均值算法的聚类中心,引导聚类过程并约束数据划分;同时还采用了核方法把输入数据映射到高维特征空间,并用核函数来实现样本之间的距离计算。在UCI数据集上进行了数值实验,并与K-均值算法和核-K-均值算法进行了比较。  相似文献   

12.
基于QPSO的数据聚类*   总被引:1,自引:0,他引:1  
在KMeans聚类、PSO聚类、KMeans和PSO混合聚类(KPSO)的基础上,研究了基于量子行为的微粒群优化算法(QPSO)的数据聚类方法,并提出利用KMeans聚类的结果重新初始化粒子群,结合QPSO的聚类算法,即KQPSO。介绍了如何利用上述算法找到用户指定的聚类个数的聚类中心。聚类过程都是根据数据之间的Euclidean(欧几里得)距离。KMeans算法、PSO算法和QPSO算法的不同在于聚类中心向量的“进化”上。最后使用三个数据集比较了上面提到的五种聚类方法的性能,结果显示基于QPSO  相似文献   

13.
基于密度的K-Means算法及在客户细分中的应用研究   总被引:4,自引:1,他引:3       下载免费PDF全文
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。  相似文献   

14.
提出一种基于K-Means聚类的人工鱼群算法, 该算法利用人工鱼群算法鲁棒性较强且不易陷入局部最优值的特点, 动态的确定了聚类的数目和中心, 解决了K-Means聚类初始点选择不稳定的缺陷, 在此两种算法融合的基础上进行图像分割处理, 经试验证明该算法效果理想.  相似文献   

15.
针对层次聚类方法与K-Means聚类方法的一些不足,提出了一种基于密度偏差抽样的改进聚类分析算法DS-Ward,该算法能够自动获得中心点和聚类数,能够在计算量减少的情况下得到较为可靠的结果。通过基于该方法的卖方信用聚类分析模型对实际数据进行分析,以发现不同类别卖方的销售信用特点。  相似文献   

16.
一种基于网格的改进的K-Means聚类算法   总被引:1,自引:0,他引:1  
K-Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K-Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出了一种基于网格的改进的K-Means聚类算法(IKMG).IKMG利用网格连通性原理并借助树形结构,将多个密集网格单元作为初始根节点,周围网格作为它的子节点,以此类推,广度优先扩展树最终得到K个聚类树.实验结果表明,IKMG不但大大缩短了K-Means算法对大数据集的处理时间,而且能有效消除聚类结果对初始聚类中心的敏感性,无需人为指定K值,能找出不同大小、不同形状的聚类.  相似文献   

17.
基于可变染色体长度的遗传K均值聚类算法   总被引:2,自引:2,他引:0  
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进.该算法可以在事先不确定K值的情况下,通过多次的选择、交叉.变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集.通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法.  相似文献   

18.
随着数据维度的增加,传统聚类算法会出现聚类性能差的现象.SubKMeans是一种功能强大的子空间聚类算法,旨在为K-Means类算法搜索出一个最佳子空间,降低高维度影响,但是该算法需要用户事先指定聚类数目K值,而在实际使用中有时无法给出准确的K值.针对这一问题,引入成对约束,将成对约束与轮廓系数进行结合,提出了一种基于成对约束的SubKMeans聚类数确定算法.改进后的轮廓系数能够更加准确的评价聚类性能,从而实现K值确定,实验结果证明该方法的有效性.  相似文献   

19.
针对网络中海量的Web服务聚类时,因其表征数据稀疏而导致使用传统建模方法所获效果不理想的问题,提出了一种基于BTM主题模型的Web服务聚类方法。该方法首先利用BTM学习整个Web服务描述文档集的隐含主题,通过推理得出每篇文档的主题分布,然后应用K Means算法对Web服务进行聚类。通过与LDA、TF IDF等方法进行对比发现,该方法在聚类纯度、熵和F Measure指标上均具有更好的效果。实验表明,该方法能够有效解决因Web服务描述所具有的短文本性质而导致的数据稀疏性问题,可显著提高服务聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号