首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
随着互联网上Mashup服务数量及种类的急剧增长,如何从这些海量的服务集合中快速、精准地发现满足用户需求的Mashup服务,成为一个具有挑战性的问题.针对这一问题,本文提出一种融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法,用于缩小服务的搜索空间,提升服务发现的精度与效率.首先,该方法对Mashup服务进行元信息提取和描述文本内容整理,并根据Web API组合的标签对相应Mashup服务标签进行扩充.然后,基于功能语义关联计算方法(Functional Semantic Association Calculation Method,FSAC)提取出各服务描述的功能名词集合,并通过功能名词的语义权重来构造Mashup语义特征向量.最后,通过基于密度信息的聚类中心检测方法(Clustering Center Detection Method based on Density Information,CCD DI)检测出最为合适的K个Mashup语义特征向量作为K means算法的初始中心,进行聚类划分.基于ProgrammableWeb的真实数据实验表明,本文所提聚类方法在纯度、精准率、召回率、熵等指标上均有良好表现.  相似文献   

2.
黄媛  李兵  何鹏  熊伟 《计算机科学》2013,40(2):167-171
聚类Web服务能大大提高W c6服务搜索引擎检索相关服务的能力。ProgrammablcWeb. com是一个很流行 的在线社会Mashup网站。作为基于Web的应用程序,Mashup本质上是开发者提供的Web服务。结合Mashup服 务的描述文档和相应标签提出一种新颖的Mashup服务聚类的方法,此外还提出一种标签推荐的方法来改进服务聚 类的性能。实验结果表明,基于标签推荐的服务聚类方法的聚类精度比其他两种实验方法要高,说明提出的标签推荐 策略有效扩充了标签数较少的Mashup服务,从而带来更多相关标签信息,因而聚类效果更好。  相似文献   

3.
陆佳炜  赵伟  张元鸣  梁倩卉  肖刚 《软件学报》2023,34(6):2727-2748
随着互联网和面向服务技术的发展,一种新型的Web应用——Mashup服务,开始在互联网上流行并快速增长.如何在众多Mashup服务中找到高质量的服务,已经成为一个大家关注的热点问题.寻找功能相似的服务并进行聚类,能有效提升服务发现的精度与效率.目前国内外主流方法为挖掘Mashup服务中隐含的功能信息,进一步采用特定聚类算法如K-means等进行聚类.然而Mashup服务文档通常为短文本,基于传统的挖掘算法如LDA无法有效处理短文本,导致聚类效果并不理想.针对这一问题,提出一种基于非负矩阵分解的TWE-NMF (non-negative matrix factorization combining tags and word embedding)模型对Mashup服务进行主题建模.所提方法首先对Mashup服务规范化处理,其次采用一种基于改进的Gibbs采样的狄利克雷过程混合模型,自动估算主题的数量,随后将词嵌入和服务标签等信息与非负矩阵分解相结合,求解Mashup服务主题特征,并通过谱聚类算法将服务聚类.最后,对所提方法的性能进行了综合评价,实验结果表明,与现有的服务聚类方法相比,所提方法在准确率、召回率、F-measure、纯度和熵等评价指标方面都有显著提高.  相似文献   

4.
基于粒子群优化的项聚类推荐算法   总被引:1,自引:2,他引:1       下载免费PDF全文
针对传统推荐算法的数据稀疏性问题和推荐准确性问题,提出基于粒子群优化的项聚类推荐算法。采用粒子群优化算法产生聚类中心,在此基础上搜索目标项目的最近邻居,并产生推荐,从而提高了传统聚类算法的推荐准确性及响应速度。实验表明改进的项聚类协同过滤算法能有效提高推荐精度。  相似文献   

5.
为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将“网页 词”矩阵向量投影到概率潜在语义向量空间,并提出“自动相似度阈值选择”方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。关键词:  相似文献   

6.
为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和任务调度的Web数据聚类算法,该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法,通过数据压缩的形式降低Web数据的复杂性,进行基于服务时间相似性的时间序列数据聚类。针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。实验仿真结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚类算法,提出的算法在聚类时间、聚类精度、服务执行成功率上均获得了更好的效果。  相似文献   

7.
针对遗传规划算法容易陷入局部最优解与局部搜索过慢的问题,提出一种基于语义聚类的遗传规划算法(genetic programming algorithm based on semantic clustering, SCGP),比较不同聚类算法对SCGP表现的影响。同时提出一种基于子种群规模的自适应适应度函数,提高局部搜索能力。在多个基准问题上对比标准遗传规划、几何语义遗传规划、K均值聚类遗传规划与SCGP,实验结果表明,SCGP算法在拟合能力和泛化能力上都有较大改善。在诸多聚类方法中,层次聚类嵌入的SCGP算法在基准问题上的泛化能力最优,与标准遗传规划、几何语义遗传规划、K均值聚类遗传规划相比,分别提高了32.36%、61.29%、20.53%。  相似文献   

8.
为提高协同过滤算法在大数据环境下的可扩展性以及在高维稀疏数据下的推荐精度,基于Spark平台实现了一种分层联合聚类协同过滤算法。利用联合聚类对数据集进行稀疏性处理并构建聚类模型,运用层次分析模型并结合评分密集度分析联合聚类模型中用户和项目潜在类别权重,由此进行项目相似度计算并构建项目最近邻居集合,完成在线推荐。通过在GroupLens提供的不同规模MovieLens数据集上实验表明,改进后的算法能够明显提高推荐的准确度,并且在分布式环境下具有良好的推荐效率和可扩展性。  相似文献   

9.
基于负载平衡的搜索算法研究   总被引:1,自引:0,他引:1  
本文针对语义拆分的平衡算法提出了基于请求者反馈的搜索算法,然后对算法的搜索长度进行了分析,通过限定负载平衡时语义类移动的最大次数和聚类中节点的数目可以控制搜索服务的最大时间延时。  相似文献   

10.
针对服务计算环境下用户对其所使用服务的评分,依据其服务关注点的不同而不同,即使是同一个服务,不同用户的评价标准也不一样,推荐者的选取不仅与其所处环境上下文有关,还与推荐者对服务的关注点有关。为了使用户推荐更加可靠、有效,提出基于服务关注点相似度的推荐算法。该算法解决了用户盲目搜索推荐者的问题,使用聚类算法生成用户聚类簇,根据用户间的相似度在聚类簇内进行推荐者的搜索,既提高了推荐的可靠性,又提高了搜索的效率。实验显示,此算法比传统算法在推荐准确性与推荐搜索效率上存在明显优势。  相似文献   

11.
基于文本聚类搜索引擎的查询扩展算法   总被引:2,自引:0,他引:2       下载免费PDF全文
目前多数基于文本聚类搜索引擎的研究对于聚类产生的小聚类簇查询未能给出深入查询解决方案,针对此类问题提出了一种基于聚类的查询扩展算法。此算法利用簇关系树结构改进相似度公式,对目标簇提取主题词并进行二次查询后,通过K中值聚类算法对查询结果进行聚类以对其进行扩展。此算法全部过程均为离线运算,旨在避免在线运算影响查询响应效率,并通过实验验证了该算法的有效性。  相似文献   

12.
为了提高运营商节假日忙时话务量的预测精度,通过分析各节假日忙时话务量数据的特点,提出基于改进半监督支持向量机预测算法。该方法采用基于图形拉普拉斯算子的半监督学习算法来变形训练支持向量回归机的核矩阵。针对图形拉普拉斯算子计算量较大的问题,采用Nystrom算法对其进行优化。仿真结果表明,提出的算法有较好的泛化能力和较高的预测精度。  相似文献   

13.
金亮  于炯  杨兴耀  鲁亮  王跃飞  国冰磊  廖彬 《计算机应用》2017,37(10):2828-2833
目前推荐系统存在评论数据稀疏、冷启动和用户体验度低等问题,为了提高推荐系统的性能和进一步改善用户体验,提出基于聚类层次模型的视频推荐算法。首先,从相关用户方面着手,通过近邻传播(AP)聚类分析得到相似用户,从而收集相似用户中的历史网络视频数据,进而形成视频推荐集合;其次,利用用户行为的历史数据计算出用户对视频的喜好值,再把视频的喜好值转换成视频的标签权重;最后,通过层次分析模型算出视频推荐集合中用户喜好视频的排序,产生推荐列表。基于MovieLens Latest Dataset和YouTube视频评论文本数据集,实验结果表明所提算法在均方根误差和决策精度方面均表现出良好的性能。  相似文献   

14.
个性化推荐系统中使用最广泛的算法是协同过滤算法,针对该算法存在的数据稀疏和扩展性差问题,提出了一种基于用户兴趣和社交信任的聚类推荐算法。该算法首先基于聚类技术根据用户评分信息将具有相同兴趣的用户聚为一类,并建立基于用户兴趣相近的邻居集合。为了提高兴趣相似度计算的准确性,采用了修正余弦计算公式来消除评分标准的差异问题。然后,引入信任机制,通过定义直接信任、间接信任、传递路径和计算方法来度量社交网络用户之间隐含的信任值,将社交网络转换为信任网络,依据信任程度来创建基于社交信任的邻居集合。通过加权的方式将基于两种邻居集合的预测值融合起来为用户产生项目的推荐。在Douban数据集上进行仿真实验,确定了最优的协调因子值和分类数值,并与基于用户的协同过滤算法和基于信任的推荐算法进行对比,实验结果表明,所提算法的平均绝对误差(MAE)减少了6.7%,准确率(precision)、覆盖(recall)和F1值分别增加了25%、40%和37%,有效提高了推荐系统的推荐质量。  相似文献   

15.
在包层次的代码重构研究中,为了得到"高内聚、低耦合"的软件结构,层次聚类算法因其简单有效、聚类精度高等特点被认为是一种较好的软件聚类方法.但是,层次聚类算法时间复杂度高,不利于处理较大规模的软件.而基于密度聚类的DBSCAN算法则与之相反,具有较快的聚类速度,但是精度却较低.因此,提出一种基于DBSCAN的软件层次聚类...  相似文献   

16.
为了解决推荐算法中无法挖掘用户深层兴趣偏好,从而导致提取准确度低下,以及相似用户聚类准确率低下时间复杂度高等问题,提出评论量化模型优化差分进化的聚类优化推荐算法(MT-QRPD)。首先利用BiGRU网络的特征时序性与CNN的强局部特征有效性联合提取评论深度特征,并利用多头注意力机制的多维语义特征筛选对评论进行深度语义特征挖掘;然后经过多层感知机非线性转换进行多特征融合完成准确量化;最后使用PCA对差分进化变异选择进行优化完成相似用户聚类优化操作,寻找相似用户完成项目推荐。通过多项实验分析表明,所提推荐算法在量化评分准确度、时间复杂度以及推荐性能上都有较好的提升。  相似文献   

17.
基于粗糙集和小生境遗传算法的层次聚类算法   总被引:1,自引:0,他引:1  
目前大部分聚类算法都面向数值属性,针对符号属性的则比较少.提出了一种新的聚类算法 RNGADHCA,该算法将基于共享机制的小生境遗传算法运用到分裂式层次聚类算法中,并用粗糙集的思想来定义遗传算法的适应度函数,实验表明,该算法在面向符号属性进行聚类时能取得较好的聚类效果.  相似文献   

18.
针对传统基于物品的推荐算法由于数据稀疏性导致的低推荐精度问题,提出了一种融合GMM聚类和FOA-GRNN模型的推荐算法。该算法首先使用高斯混合模型(GMM)方法对物品特征进行聚类;然后根据聚类结果分别构造评分矩阵,并使用Slope One算法填充评分矩阵;最后计算用户对物品的相似度预测评分作为输入,通过FOA-GRNN模型输出最终的评分。基于movielens-2k数据集的实验结果表明,与其他3种算法相比,该算法能够更好地处理高稀疏性数据,推荐精度更优,并能够在一定程度上解决冷启动问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号