共查询到20条相似文献,搜索用时 15 毫秒
1.
协同过滤算法作为一种信息筛选的重要方式,在大数据时代下受到越来越多的关注。但传统的协同过滤算法由于面临着严重的数据稀疏性以及只考虑用户间的评分相似性,导致推荐准确率较低。对此,提出了一种改进的协同过滤算法。利用[K]-means++算法对用户属性进行聚类,从而降低数据的稀疏性;考虑到用户兴趣会随时间发生动态变化,在传统的评分相似性中引入时间因素;将信任误差引入到用户间的信任关系中,从而改善用户信任度;将基于时间因素的评分相似性与改进的用户信任度进行融合,从而提高用户相似性的计算精度。在MovieLens数据集上进行仿真实验,结果表明,该算法能有效地提高推荐的预测准确性。 相似文献
2.
聚类集成是聚类的一个重要分支,它用于融合多个基聚类,来生成具有鲁棒性和高质量的最终聚类划分。将原始信息转化为共协矩阵,通过共协矩阵得到最终聚类划分的聚类集成方法是目前很多研究者研究的内容,然而大多数研究者都忽略了聚类结果容易受到噪声的影响,且忽略了共协矩阵在数据量大时,时间以及空间复杂度高的问题。为了解决以上问题,该文设计了一种基于类间相似性的聚类集成方法(CSCE)。该方法首先基于证据积累模型找到原始对象之间的相似性,将原始对象划分为多个小簇。然后通过一种新的相似度计算方法,计算簇与簇之间的相似度,形成簇与簇的相似矩阵。最后通过归一化切割(NCUT)切图的方法,将簇相似矩阵划分为最终聚类结果。该方法将低质量异常对象按相似度并入与之相似的簇中,并在8个数据集上进行了实验。结果表明,该方法不仅聚类效果好,而且解决了传统共协矩阵时间以及空间复杂度高的问题。 相似文献
3.
科学工作流执行过程中,多个任务组成的聚类作业相对单任务故障风险更高。容错聚类算法在进行故障恢复的同时面临着负载不平衡问题,为此提出了一种平衡重聚类算法(Balanced Re-clustering,BR)。该算法结合水平运行时间平衡聚类算法(Horizontal Runtime Balancing,HRB)对选择重聚类方法(Selective Re-clustering,SR)进行改进,将运行时间最长的任务分配给运行时间最短的类,在故障发生后重新运行失败的任务。实验结果表明,与现有的两种任务重聚类方法相比,BR算法的性能增益最高分别可达84%和18.75%,显著降低了工作流执行成本,提高了系统的运行效率。 相似文献
4.
5.
6.
朱俚治 《计算机测量与控制》2018,26(6):149-151
由于当今的网络数据是海量的,因此科研人员对某些问题进行研究时需要将不同属性的数据从中提取出来,然而在提取这些数据之前需要将相同数据进行聚类。数据聚类的过程,也就是寻找数据最优属性的过程,然而人工蚁群就是一种寻找问题最优解的算法,因此在本文中再次将蚁群算法在聚类中进行应用。由本文提出的聚类算法可以分为两个部分,第一部分是:通过相似性算法来衡量数据之间的相似度,第二部分是:根据第一部分的计算结果,再采用蚁群算法为需要聚类的数据选择不同的聚类中心,从而对不同属性的数据进行聚类,经过以上两个过程的计算,可以实现对数据的聚类。在本文中进行数据聚类时采用的相似性度量来代替距离的计算,是本文创新点之一,采用蚁群算法在聚类过程中来选择聚类中心也是本文的创新所在。 相似文献
7.
《计算机应用与软件》2015,(10)
由于社交网络中人物与内容之间错综复杂的关系,如何合理地给用户推荐感兴趣的内容具有十分重要的意义。提出CCVR(Core user for Clustering interesting Vector for Recommend)算法。基于用户的兴趣矩阵,运用改进的K-means算法进行聚类从而推导类兴趣向量,由此预测用户对哪些内容标签感兴趣,从而形成推荐。实验结果证明CCVR算法具有良好的准确性。 相似文献
8.
9.
传统的文本分类方法仅使用一种模型进行分类,容易忽略不同类别特征词出现交叉的情况,影响分类性能。为提高文本分类的准确率,提出基于主题相似性聚类的文本分类算法。通过CHI和WordCount相结合的方法提取类特征词,利用K-means算法进行聚类并提取簇特征词构成簇特征词库。在此基础上,通过Adaptive Strategy算法自适应地选择fasttext、TextCNN或RCNN模型进行分类,得到最终分类结果。在AG News数据集上的实验结果表明,该算法可较好地解决不同类别特征词交叉的问题,与单独使用的fasttext、TextCNN、RCNN模型相比,其文本分类性能显著提升。 相似文献
10.
聚类可应用于现代生活的诸多方面,现代生活中的数据对象往往是高维、稀疏的。对于此类高维数据,传统聚类算法不能有效地处理。提出一种基于属性相似性的改进的超图聚类算法,在原有超图聚类算法的基础上,根据超边距离阈值形成超图模型并采用超图分割法对数据对象进行聚类,采用簇内奇异特征值进行评估聚类质量。 相似文献
11.
近年来,随着建筑信息模型(BIM)构件库资源在互联网上迅猛增长,对大量 BIM 构件资源的聚类和检索应用变得日益迫切。现有方法还缺乏对 BIM 构件所承载的领域信息提取, 基于 BIM 构件所承载的领域信息,对 BIM 构件库资源开展聚类研究:①针对 BIM 构件,提出 了一种基于属性信息量的 BIM 构件相似性度量算法,以充分利用 BIM 构件属性信息。通过与 传统的Tversky相似性度量算法以及几何形状相似匹配算法相比,其在相似性度量上效果更好。 ②基于 BIM 构件间的相似性度量算法,提出了一种 BIM 构件库聚类方法。并在 BIMSeek 检索 引擎中集成了 BIM 构件的关键字检索功能以及分类器查看功能,为用户提供更丰富的检索和查 看方式。通过与传统的 K-medoids 和 AP 聚类算法相比,其聚类方法效果更好。 相似文献
12.
随着数据获取方式的多样化发展,针对多视图领域的算法研究变得越来越重要,但大多数方法仅通过自表示属性或局部结构获取样本间的相似性关系,在此过程中忽略了整体样本的聚类结构和原始空间的噪声的影响,使得聚类结果存在较大误差。为解决此问题,提出了一种基于聚类结构和局部相似性的多视图隐空间聚类方法(multi-view latent subspace clustering with cluster structure and local similarity, MLC2L),通过隐表示融合不同视图上的共享信息并抑制噪声的存在。此外,通过探索隐空间内样本间的局部相似性关系和整体的聚类结构促进样本达到同类聚合、异类远离的目的;最后引入一个交替方向迭代优化算法来快速求解目标函数。实验结果显示,在六个真实数据集的实验中,MLC2L在MSRC-v1、UCI以及100Leaves上的五个评价指标均为最优,在3Sources、WebKB和Prokaryotic等数据集上的五个指标有四个最优,大量的实验分析也证明了融合局部结构和整体聚类结构的MLC2L在多视图聚类任务上的有效性。 相似文献
13.
设计了一种对基于XML描述的软件构件进行聚类的算法(即基于模拟退火的构件聚类算法),该算法通过模拟金属退火基本原理对构件库中的软件构件聚类进行全局优化.构件聚类时,根据一般意义的树间编辑距离,提出一种用于判断基于XML描述的构件间是否相似的度量测度(称为XML编辑距离).利用XML编辑距离,可将构件间相似性度量的时间复杂度限制在多项式级,且能保持构件的XML描述文档的节点语义信息和节点间的祖孙嵌套关系.最后,在构件库测试模型上进行实验,结果证实了基于模拟退火的构件聚类算法在构件查询实践中的可行性和有效性. 相似文献
14.
15.
基于用户聚类的播客节目推荐 总被引:1,自引:0,他引:1
许多播客推荐机制一般根据整体点击次数来向用户推荐节目,但是一些点击次数很高的节目未必就是某类用户所喜欢的,因而推荐的节目对用户的喜好针对性不是很强.为了提高推荐节目对用户喜好特点的针对性,提出基于用户聚类的节目推荐.对用户在播客平台上的采集数据进行聚类分析后,把用户归为某一类型,并把该类型的所有节目根据点击次数多少存放入相应的推荐表.在用户下次登录时,根据其所属用户类型从推荐表中选出其最可能观看的尚未浏览的节目.试验结果证明,该播客推荐系统能很好地根据用户的喜好特点来进行针对性节目推荐. 相似文献
16.
聚类Web服务能大大提高W c6服务搜索引擎检索相关服务的能力。ProgrammablcWeb. com是一个很流行
的在线社会Mashup网站。作为基于Web的应用程序,Mashup本质上是开发者提供的Web服务。结合Mashup服
务的描述文档和相应标签提出一种新颖的Mashup服务聚类的方法,此外还提出一种标签推荐的方法来改进服务聚
类的性能。实验结果表明,基于标签推荐的服务聚类方法的聚类精度比其他两种实验方法要高,说明提出的标签推荐
策略有效扩充了标签数较少的Mashup服务,从而带来更多相关标签信息,因而聚类效果更好。 相似文献
17.
基于用户聚类的电子商务推荐系统 总被引:4,自引:0,他引:4
协同过滤是推荐系统中采用最为广泛和成功的推荐技术,但随着电子商务系统用户数目和商品数目的增加,在整个用户空间上搜索目标用户的最近邻居的耗时也急剧增加,导致系统性能下降.提出了一种基于用户项目类偏好值矩阵聚类的合作推荐方法,解决了"冷开始"问题,并且由于只在目标用户所属类别中搜索其最近邻居,减少了搜索空间,有效地提高推荐系统的实时响应速度. 相似文献
18.
基于会话的协同过滤用固定时间窗划分交互历史并将用户兴趣表示为这些阶段的序列,但是旅游数据的高稀疏性会导致某些阶段内没有交互行为和近邻相似度计算困难的问题。为了缓解数据稀疏,有效利用数据特性,提出了基于动态聚类的旅游线路推荐算法。该方法首先分析了旅游数据不同于其他标准数据的特性;其次利用动态聚类得到的变长时间窗口对游客交互历史进行划分,利用潜在狄利克雷分布(LDA)抽取每个阶段的概率主题分布,结合时间惩罚权值建立用户兴趣漂移模型;接着,通过反映年龄、线路季节、价格等因素的游客特征向量为目标游客选择近邻和候选线路集合;最后根据候选线路和游客的概率主题相关度完成线路推荐。该方法通过采用变长时间窗口不但缓解了数据稀疏,而且划分的阶段数目不需提前指定,而是根据数据特性自动生成;近邻选择时采用特征向量而非旅游数据进行相似度计算,避免了由于数据稀疏无法计算的问题。在实际旅游数据上的大量实验结果表明,该方法不仅很好适应了旅游数据特征,而且提高了旅游线路的推荐精度。 相似文献
19.
经典的协作式过滤算法基于记忆的非参数局部模型,该模型应用最近邻算法(K-nearest neighbors,KNN)技术,把目标用户近邻对于目标推荐项的喜好,作为向该用户进行有效推荐的标准。该方法在预测时需要较长的运算时间,并且在特定参数的限制下,不能保证对所有的用户进行有效预测。为了解决以上问题,介绍1种基于聚类模式的新的推荐方法。该算法首先假设目标用户和推荐项均能以一定的概率划归于不同的用户模式和推荐项模式中;通过计算各个用户模式对于各个推荐项模式的评分,以及用户属于不同用户模式的概率,推荐项属于不同项目模式的概率;从而产生目标用户对于具体推荐项的预测评分。通过与经典的协作式过滤推荐算法结果的对比,该方案可以在较短的时间预测所有用户对于所有推荐项的评分,并且其推荐效果与其他方法对比有了很好的改进。 相似文献
20.
目前推荐系统存在评论数据稀疏、冷启动和用户体验度低等问题,为了提高推荐系统的性能和进一步改善用户体验,提出基于聚类层次模型的视频推荐算法。首先,从相关用户方面着手,通过近邻传播(AP)聚类分析得到相似用户,从而收集相似用户中的历史网络视频数据,进而形成视频推荐集合;其次,利用用户行为的历史数据计算出用户对视频的喜好值,再把视频的喜好值转换成视频的标签权重;最后,通过层次分析模型算出视频推荐集合中用户喜好视频的排序,产生推荐列表。基于MovieLens Latest Dataset和YouTube视频评论文本数据集,实验结果表明所提算法在均方根误差和决策精度方面均表现出良好的性能。 相似文献