首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
随着近年来Web服务数量的快速增长,用户-服务QoS(Quality of Service)记录矩阵变得日益稀疏。为了解决传统协同过滤算法在稀疏数据集上预测精确性不高的问题,利用欧几里得距离对数值敏感的特点,将云模型特征向量的欧几里得距离转换成云模型的相似度。对基于云模型的协同过滤算法改进,并将改进算法用于Web服务QoS的动态预测。考虑用户调用同一服务提供商的不同服务有相似体验,再结合云模型的相似度对QoS记录矩阵进行填充,在预测用户调用某服务的QoS时使用填充后的QoS记录矩阵进行计算,从而有利于解决稀疏矩阵下预测准确度难以提高的问题。实验表明,使用该算法的预测结果相较于传统的协同过滤算法有更低的平均绝对误差(MAE),能获得更高的推荐质量。  相似文献   

2.
随着云计算理论和技术的成熟,越来越多的云服务得到了蓬勃发展,如何建立高质量的云服务成为了云计算研究领域的一个关键难题。服务质量QoS排序为用户从一系列功能相似的云服务候选者中挑选最优云服务提供了非常有价值的信息。为了获得云服务的QoS值,就需要调用真实的候选云服务。为了避免时间消耗和昂贵的资源浪费,提出了一种基于时间感知排序的云服务QoS预测方法。不同于传统的QoS值预测,基于QoS排序相似度的预测考虑为特定用户检测服务的排序。分时段按权计算出排序相似度,结合时间偏好合成相似度的前k位用户,用来提供信息支持QoS的缺失预测。在WS Dream真实数据集进行的实验研究表明,基于时间感知排序的云服务QoS预测方法有更好的预测精度。  相似文献   

3.
郭小芳  李锋 《计算机工程与应用》2012,48(23):111-114,119
为提高多元时间序列相似性度量的效率,采用扩展Frobenius范数(Eros)的主元分析(PCA)方法,通过主元和本征值构造主元相似因子,用于比较多元时间序列矩阵之间的相似性。为了验证这种方法的有效性,针对三组数据(两个真实数据,一个合成数据)进行了实验。结果表明,该方法相对于以往的欧几里德距离(ED),动态时间弯曲(DTW)相似性度量方法具有一定的优越性。  相似文献   

4.
为解决纵向数据相似性比较问题,对基于扩展范式距离的纵向数据相似性度量方法进行了研究。使用基于粗糙集理论的核约简对属性变量进行选择,移去数据集中的冗余属性;用扩展范式距离进行数据项问的度量。为计算两数据项之间的相似性,把相关度特征值当作权重,通过扩展范数距离比较项与项相应主元之间的相似性。与其它3种度最方法的对比实验显示,所提出的纵向数据相似度测量方法是有效可行的,且在信息检索时的Recall与Precision优于其它同类方法。  相似文献   

5.
一种高效的多变量时间序列相似查询算法   总被引:1,自引:0,他引:1  
周大镯  吴晓丽  闫红灿 《计算机应用》2008,28(10):2541-2543
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+ 树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。  相似文献   

6.
Web服务的聚类能够改善基于服务的应用如服务发现、组合和QoS预测等.然而目前的聚类方法在相似度度量和信息预处理方面存在一些不足.提出Web服务的QoS和功能两种相似度模型,从不同角度度量服务间的相似度.在此基础上,提出一种特殊的考虑到编程风格和命名规则的预处理方法.最后结合SCAN算法实现了本方法并设计了对比实验对提出的方法进行验证.实验结果表明提出的模型和方法能够有效地提高Web服务的聚类效果.  相似文献   

7.
云模型相似性是用来度量同类概念不同语言值的多个云之间关联程度的方法,相似云及其度量分析方法的提出是对云模型理论的扩展。针对目前相似性度量方法中时间复杂度过高和结果不稳定等不足,提出了一种基于云模型重叠度的相似性度量算法。首先,根据云模型期望、熵、超熵三个数字特征,定义两个云模型的位置关系和逻辑关系;其次,利用两个云的位置和形状特性,计算得到它们间的重叠度;最后,结合云模型重叠度与相似度的关系,将云模型的相似性度量转化为相应重叠部分的定量化描述。通过对时间序列分类实例的应用,验证了该算法在保证结果稳定度和正确率的前提下,与目前时间消耗较低的云模型相似度计算方法(LICM)相比,计算复杂度降低了50%,表明该算法具有可行性和有效性。  相似文献   

8.
李珊  俞瑛  宋波 《计算机系统应用》2016,25(11):187-192
目前已有的云服务时间序列选择算法没有很好地考虑用户的QoS(quality of service)偏好信息,而传统的用户偏好算法只适用于QoS指标值为单一数值的情况,在QoS指标值为时间序列向量的情况下无法进行有效计算.因此,本文提出了一种基于主客观综合权重的云服务时间序列选择算法(Time series of cloud services selection algorithm employing subjective and objective weight,简称TCSOW).此算法从基于用户QoS偏好层次的主观权重计算方法和基于QoS指标相关性的客观权重计算方法这两个角度进行详细描述,通过结合时间序列QoS模型进行云服务选择.实验分析表明,提出的TCSOW算法在有效解决用户QoS偏好的同时又充分考虑云服务集的QoS指标数据分布特性,使最终的度量结果具有较高的准确性与科学性.  相似文献   

9.
考虑有向无环图 (DAG)描述的组合服务模型,提出了一种新的组合服务QoS度量方法--基于拓扑序列归约的Web服务QoS度量方法(QCMTSR)。其借鉴迭代归约度量方法中的基本结构及QoS计算公式,定义了DAG图中的两类基本结构,串归约结构和并归约结构,并给出了两种基本结构的QoS属性计算公式;通过逐步归约DAG图拓扑序列中的每个节点,直至最后一个节点的QoS属性值就是组合服务的各QoS属性的度量结果。从理论上证明了QCMTSR算法适用于所有DAG描述的组合服务,并实验证明QCMTSR算法对可靠性和可用性能够更准确的度量。  相似文献   

10.
刘帅  刘长良  甄成刚 《计算机应用》2019,39(4):1229-1233
针对风电机组故障预警中,原始动态时间规整(DTW)算法无法有效度量风电机组多变量时间序列数据之间距离的问题,提出一种基于犹豫模糊集的动态时间规整(HFS-DTW)算法。该算法是原始DTW算法的一种扩展算法,可对单变量和多变量时间序列数据进行距离度量,且精度与速度较原始DTW算法更优。以子时间序列相似度距离为目标函数,使用帝国竞争算法(ICA)优化了HFS-DTW算法中的子序列长度和步距参数。算例研究表明与仅DTW算法和非参数最优的HFS-DTW算法相对比,参数最优的HFS-DTW可挖掘更多的多维特征点信息,输出的多维特征点相似序列具有更丰富细节;且基于所提算法可提前10天预警风电机组齿轮箱故障。  相似文献   

11.
时间序列的相似性度量是时间序列分析的基础工作之一,是进行相似匹配的关键。针对欧几里德距离描述分段趋势的不足和各种模式距离对应分段之间距离值的离散化问题,提出一种基于形态相似距离的时间序列相似性度量方法,标准数据集上完成的识别和聚类实验表明了该方法的可行性和有效性。  相似文献   

12.
基于分段时间弯曲距离的时间序列挖掘   总被引:22,自引:1,他引:22  
在时间序列库中的数据挖掘是个重要的课题,为了在挖掘的过程中比较序列的相似性,大量的研究都采用了欧氏距离度量或者其变形,但是欧氏距离及其变形对序列在时间轴上的偏移非常敏感.因此,采用了更鲁棒的动态时间弯曲距离,允许序列在时间轴上的弯曲,并且提出了一种新的序列分段方法,在此基础上定义了特征点分段时间弯曲距离.与经典时间弯曲距离相比,大大提高了效率,而且保证了近似的准确性.  相似文献   

13.
在时间序列相似性的研究中,通常采用的欧氏距离及其变形无法对在时间轴上发生伸缩或弯曲的序列进行相似性度量,本文提出了一种基于分段极值DTW距离的时间序列相似性度量方法可以解决这一问题。在动态时间弯曲(DTW)距离的基础上,本文定义了序列的分段极值DTW距离,并阐述了其完整的算法实现。与传统的DTW距离相比,分段极值DTW距离在保证度量准确性的同时大大提高了相似性计算的效率。文中最后运用MATLAB作对比实验,并给出实验结果数据,验证了该度量方法的有效性与准确性。  相似文献   

14.
In this paper, we consider some cosine similarity measures and distance measures between q-rung orthopair fuzzy sets (q-ROFSs). First, we define a cosine similarity measure and a Euclidean distance measure of q-ROFSs, their properties are also studied. Considering that the cosine measure does not satisfy the axiom of similarity measure, then we propose a method to construct other similarity measures between q-ROFSs based on the proposed cosine similarity and Euclidean distance measures, and it satisfies with the axiom of the similarity measure. Furthermore, we obtain a cosine distance measure between q-ROFSs by using the relationship between the similarity and distance measures, then we extend technique for order of preference by similarity to the ideal solution method to the proposed cosine distance measure, which can deal with the related decision-making problems not only from the point of view of geometry but also from the point of view of algebra. Finally, we give a practical example to illustrate the reasonableness and effectiveness of the proposed method, which is also compared with other existing methods.  相似文献   

15.
多维时序数据中的相似子序列搜索研究   总被引:4,自引:0,他引:4  
由于动态时间弯曲距离较之欧氏距离有更好鲁棒性,因此被广泛用作时序数据相似子序列搜索研究领域中的相似性度量.在单一维度上的相似子序列搜索可能不能获得足够的匹配结果作为继续深入分析的依据,因此通过引入在多维数据分析中常用的数据立方体模型将相似子序列搜索问题扩展到了多维场景之下,从而在多个维度上得到搜索结果以获取更多有价值的知识.在此基础上利用数据立方体相邻层次单元间的相关性对基本的搜索算法进行了改进,在保证准确性的基础上提高了搜索效率.在真实网络安全数据集上的实验验证了所提方法的有效性.  相似文献   

16.
基于动态时间弯曲的时序数据聚类算法的研究   总被引:14,自引:0,他引:14  
时间序列是一类重要的复杂类型数据,时间序列知识发现正成为知识发现的研究热点之一。欧几里的距离及其扩展作为相似测度被广泛应用于时间序列的比较中,但是这种距离测度对数据没有好的鲁棒性。动态时间弯曲技术是基于非线性动态编程的一种模式匹配算法。该文提出了基于动态时间弯曲技术的相似搜索算法,通过计算时序数据之间的最短弯曲路径来获得序列的匹配。对综合控制时序数据进行基于不同距离测度的聚类分析对比结果表明该文提出的算法有很高的精度和对振幅差异、噪声和线性漂移有强的鲁棒性,具有良好的应用价值。  相似文献   

17.
姜逸凡  叶青 《计算机应用》2019,39(4):1041-1045
在时间序列分类等数据挖掘工作中,不同数据集基于类别的相似性表现有明显不同,因此一个合理有效的相似性度量对数据挖掘非常关键。传统的欧氏距离、余弦距离和动态时间弯曲等方法仅针对数据自身进行相似度公式计算,忽略了不同数据集所包含的知识标注对于相似性度量的影响。为了解决这一问题,提出基于孪生神经网络(SNN)的时间序列相似性度量学习方法。该方法从样例标签的监督信息中学习数据之间的邻域关系,建立时间序列之间的高效距离度量。在UCR提供的时间序列数据集上进行的相似性度量和验证性分类实验的结果表明,与ED/DTW-1NN相比SNN在分类质量总体上有明显的提升。虽然基于动态时间弯曲(DTW)的1近邻(1NN)分类方法在部分数据上表现优于基于SNN的1NN分类方法,但在分类过程的相似度计算复杂度和速度上SNN优于DTW。可见所提方法能明显提高分类数据集相似性的度量效率,在高维、复杂的时间序列的数据分类上有不错的表现。  相似文献   

18.
伪周期数据流是一类常见的数据流,广泛出现于各种监测应用中.在这类数据流中出现的异常可能蕴涵了感兴趣的领域知识,因此有必要检测异常的发生以作为进一步深入分析的基础.DTW距离较之欧氏距离具有更好的鲁棒性,采用DTW距离作为伪周期数据流不同波段间相似性的度量可以有效检测出有较少历史相似波段的异常波段,继而在此基础上提出了一种基于聚类索引的快速近似异常波段检测方法用以加速检测过程,在真实数据集上的实验表明了所提方法的有效性.  相似文献   

19.
符号化表示是一种有效的时间序列降维技术,其相似性度量是诸多挖掘任务的基础。基于SAX(sym-bolic aggregate approximation)的距离MINDIST_PAA_iSAX不满足对称性,在时间序列挖掘中具有局限性,提出了对称的度量Sym_PAA_SAX,且下界于欧拉距离。在真实数据集和合成数据集上的实验说明下界紧密性较好,相似搜索错报率较低。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号