首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
数值型序列在很多应用中存在,如超市的POS销售记录和证券交易所的股票买卖数据等.在此类数据中查询与给定序列模式相似的子模式具有重要的现实意义.提出一种趋势融合的序列相似性查询算法NSS_QA,首先对所有序列进行单调区间的“融合”处理,然后根据各区间的长度比例和幅度比例产生序列模式的候选集,最后定义了一种新的相似性度量来...  相似文献   

2.
交通流时间序列模式相似性度量法   总被引:1,自引:0,他引:1  
针对交通流时间序列具有高维、高噪声的特性,设计了基于趋势变动、拟合优度和最小距离和百分比原则的联机分割算法用于时间序列维约简。对分割后的时间序列进行5元组分段线性表示,并据此定义五种常见的时间序列形状相似性距离。使用分层聚类算法分析它们在不同的交通流状态辨识中的效果,以此确定交通流时间序列的模式相似性度量方法。以上海南北高架东侧间部分路段固定线圈检测数据为例进行了实证分析,最终确定模式距离与欧氏距离组合方式为交通时序模式相似性度量的最佳方法。  相似文献   

3.
本文提出了一种关于布尔模式的相似性度量,以此为基础,构造了两种聚类算法。这两种算法的共同特征计算简单,并行性强,便于硬件实现,但对于变化是敏感的,其一具有较高的执行效率,其二具有较高的分类精度。  相似文献   

4.
时间序列的相似性度量是时间序列数据挖掘研究中的一个重要问题,是进行序列查询、分类、预测的一项基础工作。寻求一种好的度量对提高挖掘任务的效率和准确性有着至关重要的意义。目前从事这方面的研究除了少许理论论述外,几乎都采用一种固定的方法,即提出具体要求并提供实验数据。然而,大多数实验方法不是使用范围有限就是侧重点不同。为了提供一个比较全面的实验验证,用1NN分类算法进行了大量的时间序列交叉验证实验,重新评估了其中的弹性度量,并使用不同应用领域的28个时间序列数据集进行比较,结果表明,该方法具有更高的准确性。  相似文献   

5.
高维数据相似性度量方法研究   总被引:4,自引:0,他引:4       下载免费PDF全文
将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,Y)的改进方法HDsim(X,Y)。函数HDsim(X,Y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,Y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,Y)在高维空间中的有效性。  相似文献   

6.
时间序列形态相似性挖掘是目前时间序列数据挖掘研究的热点,然而由于时间序列数据背后真实系统的复杂性,加上观测条件的影响,时间序列会呈现多种相似性变形,如振幅伸缩、振幅漂移、线性漂移等。相似性变形并不会改变序列的形态特征,但现有的ED、DTW和Lp距离等相似性度量算法均不能有效支持识别各类相似性变形。本文首次提出涨落模式(FP)的概念,以涨落模式保存原序列的趋势变化信息,利用最长公共子序列算法计算涨落模式的相似度,消除振幅伸缩、振幅漂移和线性漂移等对相似性挖掘带来的影响,实现基于涨落模式的时间序列相似性度量。设置仿真数据集检验FP相似性度量的相似性变形支持性,同时在真实数据集上进行分类,依据分类准确性对算法鲁棒性进行评估,验证了本文提出的基于涨落模式的相似性度量算法在各类相似性形变上的有效支持性。  相似文献   

7.
基于斜率表示的时间序列相似性度量方法   总被引:5,自引:0,他引:5  
时间序列相似性搜索是数据挖掘领域的一个热点研究方向,相似性距离度量方法是其中的一个重要问题.针对含有大量噪声并存在数据缺失的高维多元时间序列数据,本文提出一种基于斜率表示的时间序列相似性度量方法.该方法是在线性分段的基础上,对两个序列间的斜率差进行加权,因而物理概念更为明确.文中还证明斜率距离完全满足相似性度量的基本准则.实例证明了算法的有效性.  相似文献   

8.
台风相似性度量方法的研究对防灾减灾、辅助决策等具有重要意义。目前,台风相似性的研究大多集中在台风路径的相似性度量上。首先,梳理影响台风相似性度量的多个要素,提出了基于多元时间序列的台风数据描述方法;其次,提出了台风时间序列完整性、一致性评估与修复方法;最后,针对台风时间序列的不等长问题,设计了一种基于主成分分析和动态时间弯曲距离的相似性度量方法。通过实验验证,该方法能够实现台风相似性的有效度量。  相似文献   

9.
为了更好地体现时间序列的形态特征,并探索更适合于较长时间序列之间相似性度量的方法,在动态时间弯曲算法的基础上进行改进,提出了基于分层动态时间弯曲的序列相似性度量方法。对时间序列进行多层次分段,并从分段中均匀抽取相对应的层次分段子序列,然后将层次分段子序列抽象为三维空间的点(反映了分段子序列的均值、长度和趋势)进行相似性度量,最后综合各个层次的相似性度量作为结果。实验表明,在参数设置合理的情况下,此方法能获得较高的序列相似性度量准确度和效率。  相似文献   

10.
时间序列数据挖掘的相似性度量综述   总被引:1,自引:0,他引:1  
在时间序列数据挖掘中, 时间序列相似性是一个重要的概念. 对于诸多算法而言, 能否与一种合适的相似性度量方法结合应用, 对其挖掘性能有着关键影响. 然而, 至今仍没有统一的度量相似性的方法. 对此, 首先综述了常用的相似性度量方法, 分析了各自的优点与不足; 其次, 讨论了近年来出现的时序相似性的新解释及其度量方法; 再次, 探讨了相似性度量在时序挖掘任务中的应用以及与挖掘精度的关系; 最后给出了关于时序相似性度量进一步的研究方向.  相似文献   

11.
本文提出了一种基于模式匹配的多序列相似性分析方法,该方法将模式匹配应用到序列比对中,采用Kimura双参数模型计算进化矩阵并构造物种进化树,进行相似性分析。实验结果表明该方法的有效性。  相似文献   

12.
时间序列序列模式的相似性研究   总被引:1,自引:1,他引:0  
林殉  李志蜀  周勇 《计算机科学》2011,38(9):245-247
时间序列序列模式相似性的度量是从时间序列中获取时序关联规则的重要环节。一般情况下,距离度量法只能度量相同长度序列模式的相似性。借用动态时间弯曲距离的思想,这种基于非线性弯曲技术的算法可以获得很高的识别、匹配精度。在定义元模式相似性的基础上,定义了序列模式的动态时间弯曲距离,最后用两个不同时间序列进行仿真实验,可以得到不同长度的序列的相似度。  相似文献   

13.
宋杰  于戈  王大玲  鲍玉斌 《计算机工程》2007,33(20):43-45,48
为了有效解决模块之间因共享数据而产生的交互耦合,提出了一种新的设计模式--注册仓模式.该模式封装了共享数据,避免了数据在各个使用者之间传递,分离了数据的提供者和使用者,实现了模块间一种简化的数据访问协议,降低了模块间的耦合度.理论和实践证明注册仓模式能良好地适用基于组件或模块的软件体系架构下面向对象的程序设计.  相似文献   

14.
提出了一种基于产生式与判别式联合模型的视觉目标跟踪算法。首先介绍了一种基于全局颜色特征直方图特征的贝叶斯分类器,检测出若干最有可能属于目标的候选区域,然后利用最佳伙伴相似性度量(Best-Buddies Similarity)得到候选区域与目标模板的相似度,结合概率值与相似度值估计出最优的目标状态。通过划分目标-背景区域模型、目标-干扰区域模型,对可能产生干扰的区域提前进行抑制,降低了长期跟踪可能产生的漂移问题的风险,同时引入了自适应尺度估计机制和在线模型更新策略,以获得更为精准的跟踪结果。在37组具有挑战性的图像序列上与7种优秀的算法对比实验表明,所提出的算法能够有效应对光照变化、遮挡、旋转与尺度变化等多种问题。  相似文献   

15.
Clustering by Pattern Similarity   总被引:2,自引:0,他引:2       下载免费PDF全文
The task of clustering is to identify classes of similar objects among a set of objects.The definition of similarity varies from one clustering model to another.However,in most of these models the concept of similarity is often based on such metrics as Manhattan distance,Euclidean distance or other L_p distances.In other words,similar objects must have close values in at least a set of dimensions.In this paper,we explore a more general type of similarity.Under the pCluster model we proposed,two objects are similar if they exhibit a coherent pattern on a subset of dimensions.The new similarity concept models a wide range of applications.For instance,in DNA microarray analysis,the expression levels of two genes may rise and fall synchronously in response to a set of environmental stimuli.Although the magnitude of their expression levels may not be close,the patterns they exhibit can be very much alike.Discovery of such clusters of genes is essential in revealing significant connections in gene regulatory networks.E-commerce applications,such as collaborative filtering,can also benefit from the new model,because it is able to capture not only the closeness of values of certain leading indicators but also the closeness of (purchasing,browsing,etc.) patterns exhibited by the customers.In addition to the novel similarity model,this paper also introduces an effective and efficient algorithm to detect such clusters,and we perform tests on several real and synthetic data sets to show its performance.  相似文献   

16.
张谦  邱玉辉 《计算机科学》2005,32(12):206-209
多Agent协商是目前人工智能、电子商务等领域研究的热点问题。在电子商务活动中为了达到更好的效果,获得更多的利益,买方希望与多个卖方进行并发协商(与多个卖方同时进行协商),从中选择最佳的交易解决方案,这种需求广泛存在。本文利用相似度方法(similarity criteria)发展和评价了一种双边多议题多Agent并发协商策略,一方面使用相似度函数来计算对手的偏好类型,从而选择相应的协商策略;另一方面协商一方采用该策略后能够使得双方达成一致的可能性最大并且收益最大,从而使得一个Agent能够在半竞争、信息不完全和不确定以及存在最大协商时间的情况下,更为有效地完成多Agent并发协商。  相似文献   

17.
数据访问对象设计模式   总被引:3,自引:0,他引:3  
与数据源特性相关的数据访问代码,往往将数据访问逻辑和业务逻辑捆绑在一起。这使替换或更改程序的数据源变得十分困难,降低程序的扩展性和移植性,同时增加了维护成本。本文详细介绍了数据访问对象设计模式:将数据源的客户访问接口和数据访问机制分离开,使特定的数据源访问AH转化成普通的客户端接口。这样数据访问机制的代码便可根据数据源的变化单独更改,系统的扩展性获得极大提升,维护亦更加容易。依据数据访问对象设计模式来设计系统能很好地解决大型J2EE应用系统设计中遇到的扩展性、维护性等问题。  相似文献   

18.
本体相似度研究   总被引:1,自引:0,他引:1  
不同本体之间的交互成为语义Web的首要任务,其中本体相似度计算是本体映射的关健环节。在以往的研究中,本体相似度计算通常专注于模式及其结构的匹配。目前研究朝着进一步考虑本体内部语义信息方向努力。本文描述了语义相似度栈的各个层次,依据各个层次的语义特征对目前本体相似度方法进行分类,并对每种方法进行了详细描述。最后对现有一些主要的本体间相似度计算方法进行归纳总结。这项研究工作将为人们提出新的相似度方法或者组合的计算方法作一个参考。  相似文献   

19.
ContextAccess control is among the most important security mechanisms, and XACML is the de facto standard for specifying, storing and deploying access control policies. Since it is critical that enforced policies are correct, policy testing must be performed in an effective way to identify potential security flaws and bugs. In practice, exhaustive testing is impossible due to budget constraints. Therefore the tests need to be prioritized so that resources are focused on their most relevant subset.ObjectiveThis paper tackles the issue of access control test prioritization. It proposes a new approach for access control test prioritization that relies on similarity.MethodThe approach has been applied to several policies and the results have been compared to random prioritization (as a baseline). To assess the different prioritization criteria, we use mutation analysis and compute the mutation scores reached by each criterion. This helps assessing the rate of fault detection.ResultsThe empirical results indicate that our proposed approach is effective and its rate of fault detection is higher than that of random prioritization.ConclusionWe conclude that prioritization of access control test cases can be usefully based on similarity criteria.  相似文献   

20.
刘爽  白亮  于天元  贾玉华 《计算机科学》2017,44(Z6):84-87, 118
随着互联网技术的迅猛发展,网络信息的呈现形式不断从简单的文本扩展到图像、声音、视频等多媒体表达形式。在多媒体信息检索领域中,传统方法往往在同一个特征空间中表示所有的媒体模式,并采取一对一的配对数据,或者利用单向排序实例作为训练样本进行检索。在此背景下,考虑了学习双向排序实例,进而实现了跨媒体检索的方法。在Wikipedia数据集上进行测试,实验结果表明,基于双向排序的跨媒体语义相似性度量方法具有更好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号