首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 486 毫秒
1.
对当前聚类算法进行研究的基础上,提出了有效地实现多元时间序列聚类的方法.用离散哈达玛变换对多元数据进行降维,求出多元变量相关系数矩阵的特征值作为权值.采用带权值的矩阵相似性度量方法,利用改进的K-means算法对多元时间序列进行聚类分析.实验结果表明,该方法能够有效地实现多元时间序列聚类,把具有相似趋势变化的多元时间序列对象划分到同一类中.  相似文献   

2.
针对经典动态规划分段算法只适用于低维时间序列的问题,提出一种基于因子模型和动态规划的多元时间序列分段方法.首先利用增量聚类自动对变化趋势相似的变量序列进行聚类,然后引入动态因子模型使降维后的低维多元时间序列能够最大限度反映原始多元时间序列的整体变化趋势,最后利用动态规划在低维多元时间序列的架构上实现高维多元时间序列的分段.实验结果表明,所提方法对变量个数较多的多元时间序列数据具有良好的分段效果.  相似文献   

3.
针对时间序列模糊C均值聚类算法对噪声数据敏感,及其未能将数据中少量已标记数据所包含的监督信息进行有效利用的问题,提出了一种改进的鲁棒性半监督模糊C均值聚类算法。该算法中先使用马氏距离提出一种样本不确定性分析方法,并加入到半监督模糊C均值聚类建模中,以消除噪声点的影响。并改进半监督模糊C均值聚类的部分监督机制来加大已标记数据的监督能力。采用能够弹性度量时间序列相似性的时间扭曲编辑距离代替欧氏距离进行聚类。通过对7组公开的时间序列数据集进行实验对比,结果表明所提算法具有良好的聚类效果。  相似文献   

4.
提出了一种简单高效的多维离散时间序列符号化方法,该方法用模糊自适应共振理论(Fuzzy ART)对多维时间序列数据进行聚类,实现多维时间序列数据的符号化问题。同时,通过属性相关性预处理分析,过滤掉聚类中不相关或弱相关的属性,保证了聚类算法的准确性,将提出的算法应用于多维交通流数据的符号化,效果很好。  相似文献   

5.
一个高效的多变量时间序列聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
时间序列聚类分析是数据挖掘研究的一个重要内容。已有的聚类算法大多采用k均值对低维数据进行聚类,不能对高维多变量时间序列(MTS)数据进行有效聚类。提出一种高效的多变量时间序列聚类算法PCA-CLUSTER,首先利用主成分分析对MTS数据降维;选取MTS数据的主成分序列进行K近邻聚类分析。理论分析和实验结果表明算法可以有效解决MTS数据聚类问题。  相似文献   

6.
唐东明  朱清新  杨凡  陈科 《软件学报》2011,22(8):1827-1837
提出了一种有效的基于仿射传播聚类算法和后处理方法的蛋白质序列聚类方法.在聚类分析蛋白质序列时,为了优化仿射传播聚类算法的聚类结果,采用后处理的方式来提高聚类结果的质量.为了度量蛋白质序列之间的相似度,给出了一种改进的无比对计算方法.在6个蛋白质序列数据集上进行对比实验,实验结果表明,所给出的方法能够有效地分析蛋白质序列.  相似文献   

7.
《微型机与应用》2015,(20):48-50
时间序列的维数比较大,直接对时间序列进行聚类性能不理想。如何提高时间序列的聚类性能,是主要研究点。首先使用邻域保持嵌入对时间序列样本维数约简,然后对维数约简后的数据进行聚类融合,最后将它的聚类性能与已有方法如主成分分析、分段聚合近似进行比较。实验表明,所提出的算法更能提高聚类性能。  相似文献   

8.
提出了一种基于DTW的符号化时间序列聚类算法,对降维后得到的不等长符号时间序列进行聚类。该算法首先对时间序列进行降维处理,提取时间序列的关键点,并对其进行符号化;其次利用DTW方法进行相似度计算;最后利用Normal矩阵和FCM方法进行聚类分析。实验结果表明,将DTW方法应用在关键点提取之后的符号化时间序列上,聚类结果的准确率有较好大提高。  相似文献   

9.
鉴于传统方法不能直接有效地对多元时间序列数据进行聚类分析,提出一种基于分量属性近邻传播的多元时间序列数据聚类方法.通过动态时间弯曲方法度量多元时间序列数据之间的总体距离,利用近邻传播聚类算法分别对数据之间的总体距离矩阵和分量近似距离矩阵进行聚类分析,综合考虑这两种视角下序列数据之间的关联关系,使用近邻传播方法对反映原始多元时间序列数据的综合关系矩阵实现较高质量的聚类.数值实验结果表明,与传统聚类方法相比,所提出方法不仅能够有效地反映总体数据特征之间的关系,而且通过重要分量属性序列之间的关联关系分析能够提高原始时间序列数据的聚类效果.  相似文献   

10.
针对三维模型聚类问题,提出一种基于骨架特征点的三维模型聚类算法.该算法首先对三维模型的二维投影图进行预处理,然后对投影图进行二级分解,提取小波分解后投影图的骨架特征点,并采用质心距离将其序列化.针对骨架特征序列非等长问题,采用基于DTW度量的K-medoids聚类算法进行聚类.最后在PSB数据集上进行实验,结果表明,该方法能够得到较好的聚类效果,对处于各个姿态的三维模型进行有效地聚类.  相似文献   

11.
为了提高大数据流滞后相关性序列挖掘效率,提出基于改进布尔约减级数分层的大数据流滞后相关性挖掘方法。该方法根据原数据流两段序列的序列均值对大数据流序列进行布尔变换,有效降低布尔约减计算开销。通过序列元素转换及还原,缩减序列元素的数目,克服传统算法在滞后相关性计算时需要计算所有数据流序列元素之间滞后相关性的弊端。实验表明,文中方法可有效减少运算时间,在保证精度的同时提高运算效率。  相似文献   

12.
为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列最相似的k个MTS序列。实验表明查询效率和准确性都有比较大的提高。  相似文献   

13.
为了减少噪声数据对查询最优序列的影响,避免Euclidean距离对形态的敏感性,以及要求序列等长的缺点,提出了面向噪声数据的时间序列相似性搜索算法.运用SPC方法去除序列中的噪声数据;采用DTW距离作为度量函数,使用规范化方法使序列处于相同的分辨率下;采用LB_ Keogh下界函数对候选序列集合进行筛选.仿真实验结果表明,该算法在阈值较小时,对含有噪声数据序列的匹配能力较强.  相似文献   

14.
目前,时间序列的相似性大多是在原始序列上进行判断和比较的,原始序列维度较高,计算量大,不利于相似性比较。提出了新的关键点(转折点或极值点)算法,除利用常用的极值法求非单调序列的关键点外,还提出了求单调序列关键点的新算法,利用该算法可以压缩时间序列,降低维度,又能保持序列的轮廓。在关键点时间序列上提出了新的相似性判定算法,利用该算法可计算任意两序列的相似度,并且提高了相似性判定的鲁棒性,减少人为干预设置阈值带来的影响。实验结果表明,基于时间序列关键点的相似性算法能很好地判定任意两序列的相似性,减少了计算量,提高了鲁棒性及减少人为干扰,对时间序列数据挖掘中的聚类与预测有很好的帮助作用。  相似文献   

15.
裁剪表示是时间序列降维表示研究领域中一种重要的数据驱动表示方法,该类方法将原始时间序列数据转换为一组由0和1组成的序列。然而,传统裁剪表示方法忽略了时间序列中数据点对序列趋势变化的影响,同时无法自定义降维表示后的压缩率。为了解决以上问题,提出了一种基于核转折点的裁剪表示方法KTPC,并基于KTPC表示方法提出了一种高效的时间序列异常检测算法KTPC-AD。所提方法按照指定的压缩率寻找时间序列中的核转折点,将时间序列转换为由核转折点裁剪表示形成的一组0和1序列,利用KTPC-AD算法计算时间序列的异常得分,最终获得异常序列。实验结果表明,KTPC方法具有较高的表示效率,基于KTPC表示的时间序列异常检测算法不仅降低了异常检测的时间复杂度,同时有效提升了异常检测精度。  相似文献   

16.
复杂系统数据序列集未来行为的预测是一个难点,利用数据挖掘实现预测是有潜力的技术途径.针对包含多元时间序列和非时间序列的实时演进数据集,整合序列分割、聚类、模式在线匹配等处理流程,提出了一种主题发现与联合决策相结合的预测方法.在整个方法构建中,将拟构造的主题发现式预测和联合决策预测融合进前期的序列分割与聚类中,采用多时间粒度、多跨度对序列进行对应分层与分割,聚合形成各层的标准模式集.再以标准模式集,依照预测策略,反向搜索具有高稳定性延展行为的复合模式作为主题模式集,从而实现基于在线模式匹配的行为预测.最后,采用分布式并行计算的架构实现整个处理算法.理论推导和实验数据分析证明,相比传统的时间序列预测方法准确度得到提高.  相似文献   

17.
研究了应用数据挖掘技术预测时间序列数据中事件的方法。针对时间序列数据提出了显著特征提取算法,给出了特征间的相似度量标准,并应用特征聚类算法,将时间序列数据转换成相应的特征序列表示。应用频繁模式发现算法和预测模式生成算法在预测时段内发现与目标事件相关的时序特征模式,预测事件的发生。实验结果表明,该文所提出的方法能够有效地预测时间序列数据中的事件。  相似文献   

18.
为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和任务调度的Web数据聚类算法,该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法,通过数据压缩的形式降低Web数据的复杂性,进行基于服务时间相似性的时间序列数据聚类。针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。实验仿真结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚类算法,提出的算法在聚类时间、聚类精度、服务执行成功率上均获得了更好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号