首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 21 毫秒
1.
针对油田注产剖面动态测试在选井上没有一个合适参考标准的问题,提出利用基于特征的聚类将油井按照生产状况进行先聚类再分类的方法。首先对油井生产时间序列数据选择处理,然后提取序列特征进行聚类,并把聚类结果划分等级,最后制定油田测试优化方案。实验结果表明,提取的时间序列特征能很好地表征油井生产波动情况,获得较好地分类效果,对指导油田测试有重要意义。  相似文献   

2.
针对类状态测试可能遗漏数据错误问题,利用数据流分析技术对生成的测试序列进行分析,找出数据流异常进而对其改进,能较好地解决数据错误问题。为解决在状态测试执行时需要插装代码来跟踪状态转换以便进行可行性检测分析,以及需要通过改写被测类代码来解决类封装性限制进行类状态验证,导致测试脚本臃肿、强聚合和被测类代码版本不一致问题,提出了一种基于AOP类状态测试执行方法,它通过分离关注点、突破类封装性限制,能有效地解决这些问题。基于上述技术和方法,提出一种类状态测试模型,实例分析和实验结果表明,该模型能较好地实现类状态测试。  相似文献   

3.
为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和任务调度的Web数据聚类算法,该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法,通过数据压缩的形式降低Web数据的复杂性,进行基于服务时间相似性的时间序列数据聚类。针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。实验仿真结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚类算法,提出的算法在聚类时间、聚类精度、服务执行成功率上均获得了更好的效果。  相似文献   

4.
基于整体和局部相似性的序列聚类算法   总被引:1,自引:0,他引:1  
戴东波  汤春蕾  熊赟 《软件学报》2010,21(4):702-717
现有的很多序列聚类算法是基于“局部特征可以表征整个序列”的假设来进行的,即不区分实际应用中序列的整体相似性和局部相似性.这对存在保守子模式的序列,如DNA和蛋白质序列是适用的,但对一些注重整体序列相似性的应用领域,如:在交易数据库中用户购买行为的比较,时间序列数据中全局模式的匹配等,由于难以产生频繁子模式,用基于全局相似性的度量方法进行聚类显得更为合理.此外,在基于局部相似性的序列聚类算法中,选取的局部子模式表征序列的能力也有待进一步提高.由此,针对不同应用领域,分别提出基于整体相似性的序列聚类算法GSClu和基于局部相似性的序列聚类算法LSClu.GSClu和LSClu分别利用带剪枝策略的二分k均值算法和基于有gap约束的强区分度子模式方法对各自领域的序列数据进行聚类.实验采用交易序列数据和蛋白质序列数据,实验结果表明,GSClu和LSClu对各自领域的序列数据具有较快的处理速度和良好的聚类质量.  相似文献   

5.
针对符号序列聚类中表示模型及序列间距离度量定义的困难问题,提出一种基于概率向量的表示模型及基于该模型的符号序列聚类算法。该模型引入符号序列的概率分布表示法,定义了一种基于概率分布差异的符号序列距离度量及该模型的目标函数,最后给出了一种符号序列K-均值型聚类算法,并在来自不同领域的实际应用序列集上进行了实验验证。实验结果表明,与基于子序列表示模型的符号序列聚类算法相比,所提方法在DNA序列和语音序列等具有较多符号的实际数据上,有效提高聚类精度的同时降低聚类时间50%以上。  相似文献   

6.
在用电信息采集系统中,由于采集和配电设备的海量接入,终端获取的分钟冻结数据普遍存在缺失。针对该问题,提出一种基于聚类的时间序列预测方法填充缺失值。该方法利用终端获取的分钟冻结数据具有时序自相似和关联性特征,首先对终端聚类,使具有相似时序特征的终端在同一分组,针对长时间序列具有的高维特征造成聚类困难的问题,使用自编码器降维,提高聚类性能;然后,对各分组建立基于长短期记忆(LSTM)单元的神经网络模型预测缺失值。实验结果表明该方法能有效利用终端时间序列的特性,验证了基于自编码器的聚类可提升预测性能。  相似文献   

7.
为了解决复杂网络的数据竞争和规避问题,基于类脑智能与复杂网络相结合提出了一种机会数据竞争规避机制。首先,针对大规模多变和动态复杂网络,基于拓扑演变建立了复杂网络机会数据竞争模型。其次,在已发生竞争的数据集合与复杂子网之间建立映射矩阵,通过类脑智能优化数据竞争序列,机会控制复杂网络大规模信息处理和数据规避。实验结果表明,所建立的数据竞争规避算法对于数据集损耗较低而且具有较高的数据竞争检测效率。同时,所提出的算法与插入随机延迟规避机制相比具有低能耗优势。  相似文献   

8.
针对存在异常值的时间序列数据,提出了一种基于相关系数鲁棒估计的时间序列间的鲁棒广义互相关度量(RGCC)。首先,引入一种鲁棒相关系数代替Pearson相关系数来计算时间序列数据间的协方差矩阵;其次,用新的协方差矩阵的行列式构造两个时间序列间的相似性度量——RGCC;最后,基于该度量计算出序列间的距离矩阵,将其作为聚类算法的输入对数据进行聚类。时间序列聚类仿真实验表明,对存在异常值点的时间序列数据,与基于原始的广义互相关度量(GCC)得到的聚类结果相比,基于RGCC得到的聚类结果明显更接近真实的聚类结果。可见,所提出的新的鲁棒相似性度量完全适用于存在异常值的时间序列数据。  相似文献   

9.
类集成测试序列的确定是面向对象类集成测试技术中的一个重要课题。合理的类集成测试序列可以降低为其构造测试桩的总体复杂度,从而减小测试代价。针对粒子群优化算法容易早熟的缺陷,文中提出一种基于梦境粒子群优化算法的类集成测试序列生成方法。首先把每个类集成测试序列映射为一维空间中的一个粒子,然后将粒子看作有做梦能力的个体。每个迭代周期分为白天和夜间两个阶段,在白天阶段粒子正常移动,而在夜间阶段粒子根据各自的做梦能力扭曲当前位置。如此,粒子有机会在当前位置附近进行搜索,使得算法减缓收敛速度,避免过早陷入局部最优。实验结果表明,多数情况下该方法可以得到测试代价更小的类集成测试序列。  相似文献   

10.
对存在于网络信息、观测数据以及生物信息中的大量相似数据,使用传统的压缩方法压缩不能达到更好的效果。对相似度很高的数据采用一种新的无损压缩方法,即基础序列加上一组基于编辑距离的差异量来表示整个数据集,可以只用很少的差异量来表示原本巨大的数据项。针对现实中数据不会整体相似的特点,提出一种先聚类再压缩的思想,在每个聚类中构造聚类中心作为虚拟基础序列,使压缩比最大化。通过大量实际数据集的实验测试与分析,表明提出的无损压缩技术对于相似序列数据具有很好的压缩比。  相似文献   

11.
一种基于Normal矩阵的时间序列聚类方法*   总被引:2,自引:0,他引:2  
提出了一种基于Normal矩阵的时间序列聚类方法。该算法首先对时间序列数据进行向量形式转换,计算出各个时间序列间的相似度并构建复杂网络,然后利用基于Normal矩阵的方法进行复杂网络社团划分,同一类的时间序列被划分到一个社团,即实现对时间序列数据的聚类。为了验证该方法的可行性和有效性,将其应用于股票时间序列数据聚类分析中,并在两个实际的数据集上与其他方法相比较,取得了较好的实验结果。  相似文献   

12.
唐东明  朱清新  杨凡  陈科 《软件学报》2011,22(8):1827-1837
提出了一种有效的基于仿射传播聚类算法和后处理方法的蛋白质序列聚类方法.在聚类分析蛋白质序列时,为了优化仿射传播聚类算法的聚类结果,采用后处理的方式来提高聚类结果的质量.为了度量蛋白质序列之间的相似度,给出了一种改进的无比对计算方法.在6个蛋白质序列数据集上进行对比实验,实验结果表明,所给出的方法能够有效地分析蛋白质序列.  相似文献   

13.
针对基于状态的类测试技术缺陷检测率较低的问题,提出一种使用等价类划分和边界值分析等功能性测试方法构建UML状态图的方法,描述基于W方法的测试序列生成策略,使用Mujava变异工具对方法的有效性进行检测。实验结果表明,该测试策略具有较高的缺陷检测率。  相似文献   

14.
烧结过程的运行性能是生产效率和能源利用的综合表现. 运行性能评价是保持烧结过程的运行性能处于最优等级的前提. 考虑到时间序列数据的冗余, 提出一种基于粒度聚类的铁矿石烧结过程运行性能评价方法. 首先, 利用单因素方差分析方法选取影响运行性能等级的检测参数; 然后, 采用多粒度区间信息粒化实现检测参数时间序列数据的降维, 并进行粒度聚类, 得到聚类标签; 最后, 以聚类得到的聚类标签为输入, 利用随机森林算法进行运行性能等级评价. 利用实际钢铁企业的运行数据进行实验, 构建两个对比实验, 分别采用基于时间序列数据聚类(Time series data clustering, TSDC)方法和基于时间序列特征聚类(Time series feature clustering, TSFC)方法. 实验结果表明, 该方法为有效评价烧结过程的运行性能提供了一套可行方案, 为操作人员提升烧结过程运行性能提供了有力的指导.  相似文献   

15.
基于EDPN的类测试框架及测试用例生成技术的研究   总被引:1,自引:0,他引:1  
针对基于状态的面向对象软件的类测试过程中存在的不可预测、不可达状态、状态组合“爆炸”和测试用例“爆炸”等问题,提出了基于EDPN模型的类测试、类的交互测试和类的层次测试框架,设计了相应的测试模型;提出了基于EDPN的有标记的唯一输入输出(UIO)测试用例的自动生成方法,生成状态转移路径序列,测试类的状态;提出了基于扩展的EDPN的状态组合的标记关联递推法,生成扩展的正交阵列表,测试类的交互;提出了基于扩展的EMDPN的协同路径(copaths)测试用例的生成方法,生成协同路径序列,测试类的层次。  相似文献   

16.
基于蚁群优化聚类算法的DNA序列分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对目前聚类算法在分析DNA序列数据时的低效性和分类精度低问题,提出一种基于蚁群优化聚类算法(ACOC)的DNA序列分类方法,在密度函数中加入自适应感应量并应用模拟退火中的α-适应量的冷却策略,采用DNA序列分布特征对DNA序列进行特征提取,并将pearson相关系数引入蚁群聚类算法作为相似性度量。在EMBL-DNA数据库中4个数据集上进行性能测试,与统计聚类和k-means算法的比较表明,该方法具有一定的时间和精度的优越性,适于解决大规模DNA序列数据分类问题。  相似文献   

17.
本文提出了一种基于隐马尔可夫模型的二次k-均值聚类算法并实现了对基因序列数据的建模与聚类。算法首先引入了同源基因序列核苷酸比率趋向于一致的生物学特征来对基 因序列数据进行初次k-均值聚类,然后利用第一次聚类结果训练出表征序列特征的隐马尔可夫模型,最后采用基于模型的k-均值方法再次聚类。实验结果表明,该算法是可行的,,并且具有较好的聚类质量。  相似文献   

18.
研究了如何使用SP-Feature来压缩序列模式。SP-Feature是一种简洁表示序列模式的新颖结构。一种新的相似性度量被用来聚类SP-Feature,同时也给出了SP-Feature的合并方法。基于层次聚类框架,设计了一种有效的挖掘压缩序列模式的算法CSP。在真实和模拟数据上的大量实验表明CSP能够快速有效地压缩序列模式(在稠密数据集上的恢复误差小于4%)。  相似文献   

19.
研究了如何使用SP-Feature来压缩序列模式。SP-Feature是一种简洁表示序列模式的新颖结构。一种新的相似性度量被用来聚类SP-Feature,同时也给出了SP-Feature的合并方法。基于层次聚类框架,设计了一种有效的挖掘压缩序列模式的算法CSP。在真实和模拟数据上的大量实验表明CSP能够快速有效地压缩序列模式(在稠密数据集上的恢复误差小于4%)。  相似文献   

20.
时间序列相似度是时间序列数据挖掘的重要研究方向之一。如何利用时间序列相似度对提高时间序列数据聚类有着重要的意义。提出一种基于时间序列相似度的半监督谱聚类算法,通过选取适当的时间序列特征构造相似度与距离,在谱聚类算法的基础上利用标签数据选取初始类簇。实验表明,该算法使具有相似特征的时间序列可以很有效地被聚集到同一类中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号