首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
在实际的数据迁移项目中,为了解决数据映射的问题,需要确定两个工作流模型之间的相似度。从工作流模型的相似性方面进行分析阐述,提出了基于Petri网的工作流模型展开树的路径序列相似性算法,首先采用深度优先搜索算法和动态规划算法对模型进行搜索,其次通过提出的算法获取展开树的所有路径序列,最后利用编辑距离算法计算两个模型序列之间的两两相似度,进而完成模型相似性计算,相较于其他的主流相似度算法,主要优点在于可以精确计算得到模型部分结构和行为相似度,可以更好的确定流程间映射,从而找到数据映射的解决方法。实验结果表明:该方法较主流的基于模型结构和行为相似性算法,计算合理性和准确性有很大提升。  相似文献   

2.
零件工序模型几何演变序列生成方法及应用   总被引:1,自引:0,他引:1  
针对机加工艺知识挖掘与重用困难的问题,分析得出工艺知识隐藏在零件工序模型序列的几何变化之中,并进一步提出工序模型几何演变序列的生成和相似性度量方法以及特征匹配算法.首先对工序模型的几何变更进行提取和表示,并将整个工序模型序列中所有前、后道工序间的几何变更按照工艺过程的优先级约束组成了几何演变序列;然后建立零件工序模型几何演变序列的相似性度量算法,并以算法的计算结果作为衡量零件工艺相似性的依据;在几何演变序列中提取出参与特征形成过程的变更元素建立新的加工特征模型,并通过构建特征的匹配算法来为融入加工特征形成过程的更高维的特征识别与匹配提供依据.实例结果表明,文中方法是可行性的.  相似文献   

3.
机加工艺过程从表象看是一道道工序加工方法组成的序列,但从内里看其实是工件从初始毛坯模型到最终成品模型的几何结构演变过程,单纯从工序加工序列或三维几何结构的角度出发进行相似性检索会降低检索到工艺的有效性.针对以上问题,提出一种符号熵驱动的零件机加工艺过程的多维度相似性度量方法.首先建立基于符号熵的序列相似性度量方法,直接对加工方法序列进行相似性计算;然后建立与加工方法序列对应的几何演变序列,并在符号熵方法的支持下实现对几何演变过程的相似性度量;最后将加工方法序列的相似性计算结果及对应几何演变过程的相似性计算结果进行融合,实现对机加工艺过程相似性的多维度和精准评价.实例结果表明,所提方法在度量不同类型机械零件的工艺相似性时,评价结果更贴近实际制造工艺过程和工艺人员的经验认知,证明方法是可行的.  相似文献   

4.
为解决现有协议建模方法验证困难及测试序列生成算法复杂度高和测试序列长的问题,提出了一种基于行为树(BT)的协议描述新方法.采用行为树模型对协议的控制流程进行建模,提出了基于行为树描述的协议验证方法,并给出了基于行为树的测试序列生成方法.以某监控协议为例给出了基于行为树的建模过程,将所建模型转换为通信顺序进程(CSP)后采用过程分析工具(PAT)完成了协议验证,并完成了测试序列的计算与对比分析,结果表明提出的方法能方便地完成对协议的描述与验证,能降低测试序列计算复杂度并减少生成的测试序列长度.  相似文献   

5.
基于整体和局部相似性的序列聚类算法   总被引:1,自引:0,他引:1  
戴东波  汤春蕾  熊赟 《软件学报》2010,21(4):702-717
现有的很多序列聚类算法是基于“局部特征可以表征整个序列”的假设来进行的,即不区分实际应用中序列的整体相似性和局部相似性.这对存在保守子模式的序列,如DNA和蛋白质序列是适用的,但对一些注重整体序列相似性的应用领域,如:在交易数据库中用户购买行为的比较,时间序列数据中全局模式的匹配等,由于难以产生频繁子模式,用基于全局相似性的度量方法进行聚类显得更为合理.此外,在基于局部相似性的序列聚类算法中,选取的局部子模式表征序列的能力也有待进一步提高.由此,针对不同应用领域,分别提出基于整体相似性的序列聚类算法GSClu和基于局部相似性的序列聚类算法LSClu.GSClu和LSClu分别利用带剪枝策略的二分k均值算法和基于有gap约束的强区分度子模式方法对各自领域的序列数据进行聚类.实验采用交易序列数据和蛋白质序列数据,实验结果表明,GSClu和LSClu对各自领域的序列数据具有较快的处理速度和良好的聚类质量.  相似文献   

6.
利用数据挖掘技术分析网络学习行为数据可以挖掘出其隐含的行为规律特征,为学习者提供个性化的学习资源服务。针对现有的数据挖掘算法在对网络学习行为数据进行分析时普遍存在模型适用性不高的问题,提出了一种基于行为序列分析的学习资源推荐算法。首先,提出行为序列及其相关概念的定义,并提出行为序列相似度计算方法;然后提出基于行为序列相似度的协同过滤推荐算法,计算学习者相似度并为待推荐学习者生成学习资源推荐列表;接着给出基于学习风格的推荐方法,将学习者学习风格特征融入推荐过程;最后,给出基于行为序列分析的学习资源推荐算法的模型。提出的算法没有对行为序列的模式进行限制,具有较高的适用性,对深入研究网络学习行为序列数据为学习者提供个性化学习服务具有一定的借鉴作用。  相似文献   

7.
针对现有的流程模型行为相似性度量方法大都基于变迁的发生序列, 存在时间复杂度较高的问题, 提出一种基于活动发生关系的流程相似性度量方法. 首先, 形式化左右集概念, 并引入违背度和左右集权重$\alpha,\beta$, 通过活动间的关系变化来确定$\alpha$和$\beta$的取值, 进而得到活动的相似性; 然后, 将流程中活动的相似性进行归一化, 提出基于活动发生关系的流程相似性算法(AOR), 进行业务流程的相似性度量. 最后, 使用实际事件数据案例对本文方法进行了评估, 实验结果表明: 该方法能够正确计算两个不同流程之间的相似性, 且具有较好的时空复杂度.  相似文献   

8.
序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义.序列相似性算法包括基于序列比对的方法及非比对方法两种.基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异.因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量.使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合.通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性.  相似文献   

9.
移动用户的位置轨迹中蕴含着用户的运动规律,行为模式等丰富的信息。重点关注用户轨迹中的停留区域,从轨迹间共同停留区域的时空重叠中挖掘用户行为兴趣的相似性,提出一种基于最长公共子序列的用户时空行为兴趣相似性计算方法。提取轨迹中的停留区域,利用最小包围盒技术描述轨迹中的停留区域,结合最长公共子序列算法提出一种基于最长公共子包围盒长度的用户相似性计算方法。实验收集60个志愿者6周的真实时空轨迹数据来评价该方法,实验结果表明该方法具有较高的准确率。  相似文献   

10.
虚拟空间中在线同源用户具有相似行为特征,但现有相似性度量算法难以对其进行有效识别。提出一种基于序列对齐的在线同源用户识别算法,根据在线用户行为日志提取点击流数据,采用序列对齐方法计算在线用户的行为相似度,将其用行为相似度矩阵表示并对用户进行层次聚类,以识别虚拟空间中的在线同源用户,同时分析不同维度的用户特征属性对用户行为相似性的影响程度。实验结果表明,该算法能准确识别出在线同源用户,用户行为相似性受性别、户籍和教育程度3种特征属性影响较大,受年龄、社会阶层和收入水平的影响较小。  相似文献   

11.
Many activities in business process management, such as process retrieval, process mining, and process integration, need to determine the similarity or the distance between two processes. Although several approaches have recently been proposed to measure the similarity between business processes, neither the definitions of the similarity notion between processes nor the measure methods have gained wide recognition. In this paper, we define the similarity and the distance based on firing sequences in the context of workflow nets (WF-nets) as the unified reference concepts. However, to many WF-nets, either the number of full firing sequences or the length of a single firing sequence is infinite. Since transition adjacency relations (TARs) can be seen as the genes of the firing sequences which describe transition orders appearing in all possible firing sequences, we propose a practical similarity definition based on the TAR sets of two processes. It is formally shown that the corresponding distance measure between processes is a metric. An algorithm using model reduction techniques for the efficient computation of the measure is also presented. Experimental results involving comparison of different measures on artificial processes and evaluations on clustering real-life processes validate our approach.  相似文献   

12.
This paper presents a method for classifying a large and mixed set of uncharacterized sequences provided by genome projects. As the measure of sequence similarity, we use similarity score computed by a method based on the dynamic programming (DP), such as the Smith-Waterman local alignment algorithm. Although comparison by DP based method is very sensitive, when given sequences include a family of sequences that are much diverged in evolutionary process, similarity among some of them may be hidden behind spurious similarity of some unrelated sequences. Also the distance derived from the similarity score may not be metric (i.e., triangle inequality may not hold) when some sequences have multi-domain structure. To cope with these problems, we introduce a new graph structure called p-quasi complete graph for describing a family of sequences with a confidence measure. We prove that a restricted version of the p-quasi complete graph problem (given a positive integer k, whether a graph contains a 0.5-quasi complete subgraph of which size k or not) is NP-complete. Thus we present an approximation algorithm for classifying a set of sequences using p-quasi complete subgraphs. The effectiveness of our method is demonstrated by the result of classifying over 4000 protein sequences on the Escherichia coli genome that was completely determined recently.  相似文献   

13.
流程相似度的计算在企业业务流程管理中具有重要作用。目前相似度的计算主要存在两个问题:一是大多数相似度计算方法只考虑模型结构或事件日志,导致算法不够精确;二是综合考虑了模型结构和事件日志的算法复杂度高且效率低。因此,提出了一种改进的流程模型结构和事件日志相结合的方法。首先将流程模型结构中的紧邻活动转化为邻接矩阵,然后根据事件日志中的行为信息对邻接矩阵进行加权得到加权邻接矩阵,最后采用符合距离度量特性的矩阵间距离的算法来度量流程间相似度。通过实验与MDS、GED以及WBPG等算法进行对比,所提方法的准确率更高,为99.51%,计算效率也更高。  相似文献   

14.
Matching visual appearances of the target object over consecutive frames is a critical step in visual tracking. The accuracy performance of a practical tracking system highly depends on the similarity metric used for visual matching. Recent attempts to integrate discriminative metric learned by sequential visual data (instead of a predefined metric) in visual tracking have demonstrated more robust and accurate results. However, a global similarity metric is often suboptimal for visual matching when the target object experiences large appearance variation or occlusion. To address this issue, we propose in this paper a spatially weighted similarity fusion (SWSF) method for robust visual tracking. In our SWSF, a part-based model is employed as the object representation, and the local similarity metric and spatially regularized weights are jointly learned in a coherent process, such that the total matching accuracy between visual target and candidates can be effectively enhanced. Empirically, we evaluate our proposed tracker on various challenging sequences against several state-of-the-art methods, and the results demonstrate that our method can achieve competitive or better tracking performance in various challenging tracking scenarios.  相似文献   

15.
This paper proposes a new temporal error concealment algorithm in H.264 video sequences based on scene change detection and PCA model. In order to detect scene change, dynamic threshold and image similarity metric are presented using coding prediction mode and DCT AC energy in H.264 baseline. UPCA (Updated PCA) model is presented by combining the scene change feature with Index transformation-Buffer updating approach. The lost images are concealed by Projection onto Convex Sets algorithm with UPCA model. Experimental results show that the proposed algorithm can achieve better error concealment performance for the higher motion and the frequent scene change, compared with the related method.  相似文献   

16.
基于广义超曲面树的相似性搜索算法   总被引:2,自引:0,他引:2  
张兆功  李建中 《软件学报》2002,13(10):1969-1976
相似性搜索是数据挖掘的主要领域之一.它在数据库中检索出相似的数据,发现数据间的相似性.它可以应用于图像数据库、空间数据库和时间序列分析.对于欧氏空间(一种特殊的度量空间),相似性搜索算法中基于R-tree的方法,在低维时是高效的,当维数增加时,R-tre e的方法将退化为线性扫描.该现象被称为维数灾难(dimensionality curse),主要原因是存在数据重复.当数据量很大且维数很高时,距离计算和I/O操作将非常费时.提出了度量空间上新的空间分割方法和索引结构rgh-tree,利用数据库的数据对象与很少几个固定参考对象的距离信息进行数据分割和分布,产生一个各节点没有数据重复的平衡树.另外,在rgh-tree的基础上提出了相应的相似性搜索算法,该算法具有较小的I/O代价和距离计算次数,平均复杂性近似为o(n0.58).解决了目前算法存在的一些问题.  相似文献   

17.
贾楠  付晓东  黄袁  刘晓燕  代志华 《计算机应用》2012,32(12):3529-3533
在工作流的发现和聚类等应用中,需要对两个工作流模型的距离进行度量。因此,提出一种计算两个不同结构化工作流的距离定量度量方法。首先介绍了结构化工作流,并将每一个结构化工作流转换为流程结构树;然后基于两个结构树之间的树编辑距离来计算工作流之间的距离及相应相似度。该距离度量方法满足距离度量的3个属性,即同实体不可区分性、对称性和三角不等式性质。这些属性使得该距离度量方法可以在工作流模型管理活动中作为定量分析工具。实验结果表明,基于树编辑距离的工作流度量方法是可行的。同时,与基于邻接矩阵的距离度量方法相比,该方法考虑了不同结构之间的语义距离,有效验证了此方法的合理性。  相似文献   

18.
王丽丽  林海  包亮  万贺 《测控技术》2019,38(5):13-17
为了使复杂装备信息处理系统在进行故障定位过程中耗时最少、成本最低,建立了系统测试序列优化问题的数学模型。基于DPSO-AO*算法的改进,得到信息处理系统的最优测试策略决策树,根据信息处理系统的相关矩阵,按故障概率,随机生成故障,采用相应的测试序列进行测试,最后利用累计测试费用进行比较,从而证明了改进的DPSO-AO*算法正确有效。  相似文献   

19.
传统协同过滤推荐算法的相似度量方法仅考虑用户间共同评分,忽略了用户间潜在共同评分项等信息量对推荐结果的影响。针对上述问题,设计了一种正态分布函数相似度量模型,此模型考虑了用户间的共同评分、共同评分项目数、以及用户的评分值,据此提出了融合正态分布函数相似度的协同过滤算法,该算法通过综合多种评分因素利用正态分布函数和修正的余弦相似度共同度量用户间的相似关系。实验结果表明,在两种数据集上与几种不同的推荐算法相比,该算法的相似度量方法提高了目标用户查找邻近用户集合的准确率,提高了系统的推荐质量。  相似文献   

20.
Recent advances in kinship verification have shown that learning an appropriate kinship similarity metric on human faces plays a critical role in this problem. However, most of existing distance metric learning (DML) based solutions rely on linearity assumption of the kinship metric model, and the domain knowledge of large cross-generation discrepancy (e.g., large age span and gender difference between parent and child images) has not been considered in metric learning, leading to degraded performance for genetic similarity measure on human faces. To address these limitations, we propose in this work a new kinship metric learning (KML) method with a coupled deep neural network (DNN) model. KML explicitly models the cross-generation discrepancy inherent on parent-child pairs, and learns a coupled deep similarity metric such that the image pairs with kinship relation are pulled close, while those without kinship relation (but with high appearance similarity) are pushed as far away as possible. Moreover, by imposing the intra-connection diversity and inter-connection consistency over the coupled DNN, we introduce the property of hierarchical compactness into the coupled network to facilitate deep metric learning with limited amount of kinship training data. Empirically, we evaluate our algorithm on several kinship benchmarks against the state-of-the-art DML alternatives, and the results demonstrate the superiority of our method.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号