首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 593 毫秒
1.
一种高效的多变量时间序列相似查询算法   总被引:1,自引:0,他引:1  
周大镯  吴晓丽  闫红灿 《计算机应用》2008,28(10):2541-2543
为了高效地执行多变量时间序列(MTS)相似查询,提出一种基于距离的索引结构(Dbis)相似查询算法。采用主成分分析方法对MTS数据进行降维处理;聚类MTS主成分序列,选择每类质心作为参考点;依据参考点将每类变换到一维空间,这样可以利用B+ 树结构进行索引查询;MTS序列比较相似采用的是扩展的Frobenius范数(Eros)。通过对股票数据集实验验证了Dbis算法的高效性。  相似文献   

2.
通过分析在电子商务环境下Web挖掘的现状,考虑到Web数据的海量性和高维度性对抽取隐含的、事先未知的知识所带来的复杂性和维数灾,在普通K均值聚类、PSO聚类和K均值与PSO混合聚类算法的基础上,提出了一种将主成分分析与PSO混合聚类算法相结合的模型来对Web服务器中的日志文件进行聚类分析,将抽取的相关Web数据进行主成分分析,分析结果作为PSO混合聚类算法的输入数据,这样不仅减少了输入变量的维数,减少聚类的规模,而且保留了原始变量的主要信息,消除变量之间的多重共线性,为具有海量性、高维度性、异构性等特点的  相似文献   

3.
为提高多元时间序列相似查询执行效率,采用了基于距离索引结构的相似查询算法。利用主成分分析方法对多元时间序列数据降维并在此基础上进行聚类,以聚类质心为参考点,将各类变换到一维空间,利用B+-tree结构进行索引查询,找到与查询序列最相似的k个MTS序列。实验表明查询效率和准确性都有比较大的提高。  相似文献   

4.
《微型机与应用》2015,(20):48-50
时间序列的维数比较大,直接对时间序列进行聚类性能不理想。如何提高时间序列的聚类性能,是主要研究点。首先使用邻域保持嵌入对时间序列样本维数约简,然后对维数约简后的数据进行聚类融合,最后将它的聚类性能与已有方法如主成分分析、分段聚合近似进行比较。实验表明,所提出的算法更能提高聚类性能。  相似文献   

5.
霍纬纲  程震  程文莉 《计算机应用》2017,37(12):3477-3481
针对已有基于模型的多维时间序列(MTS)聚类算法处理不等长MTS速度较慢的问题,提出了一种基于LR分量提取的MTS聚类算法(MUTSCA〈LRCE〉)。首先,采用等频离散化方法符号化MTS;然后,计算用于表达MTS样本各维时间序列之间时序模式的LR向量,对每个LR向量进行排序后从其两端提取固定数目的不同关键分量,所有提取的关键分量拼接形成表示MTS样本的模型向量,该过程将不等长MTS样本集转换为等长的模型向量集;最后,采用k-means算法对生成的等长模型向量集进行聚类分析。在多个公共数据集上的实验结果表明,与基于模型的MTS聚类算法——MUTSCA〈LR〉相比,所提算法能够在保证聚类效果的前提下,显著提高不等长MTS数据集的聚类速度。  相似文献   

6.
对当前聚类算法进行研究的基础上,提出了有效地实现多元时间序列聚类的方法.用离散哈达玛变换对多元数据进行降维,求出多元变量相关系数矩阵的特征值作为权值.采用带权值的矩阵相似性度量方法,利用改进的K-means算法对多元时间序列进行聚类分析.实验结果表明,该方法能够有效地实现多元时间序列聚类,把具有相似趋势变化的多元时间序列对象划分到同一类中.  相似文献   

7.
马雪婧  朱杰  王直  王加友 《测控技术》2012,31(12):104-107
为提高多元时间序列聚类算法的效率,采用基于主元分析的多元时间序列聚类方法,将原始多元时间序列元素划分成一系列互不相关的簇,根据各簇的代表元素和剩余元素的主元素之间的扩展欧几里德范数对多元时间序列进行聚类分析.理论分析和实验结果表明该算法聚类质量结果和运行时间明显优于直接利用K-means法时的聚类结果.  相似文献   

8.
基于异常序列剔除的多变量时间序列结构化预测   总被引:1,自引:0,他引:1  
针对传统多变量时间序列预测方法未考虑变量间依赖关系从而影响预测效果的问题,提出了一种基于异常序列剔除的多变量时间序列预测算法.该算法旨在利用多维支持向量回归机(Multi-dimensional support vector regression,M-SVR)内在的结构化输出特性,对选取到具有相似性的多个变量序列进行联合预测.首先,对已知序列进行基于模糊熵的层次聚类,实现对相似序列的初步划分;其次,求出类中所有序列的主曲线,根据序列到主曲线的距离计算各个序列的异常因子,从而进一步剔除聚类结果中的异常序列;最后,将选取到的相似变量序列作为输入,利用M-SVR进行预测.通过理论分析,证明本文算法在理论上存在信息损失上界与可靠度下界,从而说明本文算法的合理性与可行性.采用混沌时间序列数据与多个实际数据集进行对比实验,结果表明,与现有多个代表性方法相比,本文算法可有效挖掘多变量时间序列的内在结构信息,预测精度更高,数值稳定性更好.  相似文献   

9.
时间序列数据挖掘是数据挖掘领域的热点之一。相似性度量是时序挖掘领域的基础问题,直接决定了时序数据分类和聚类的效果。针对现有经典的时序数据相似性度量方法共同主成分分析(CPCA)和二维奇异值分解(2DSVD)中存在无法保存时序数据集合中蕴含的某些重要局部特征的问题,提出了基于数据分块方式的CPCA方法和2DSVD方法。该算法首先对原始多变量时间序列数据进行分块处理,然后对分块得到的子矩阵采用CPCA、2DSVD进行特征提取,从而得到代替原始模式的低维新模式,最后在低维空间中利用最小距离法构建分类器对多变量时间序列进行分类。EEG数据分类实验证明了所提方法的有效性。  相似文献   

10.
现有的关于多变量时间序列聚类的研究中所研究的变量规模均较少,而现实生活又经常会出现大规模多变量时间序列,因此提出了LS-Cluster算法,旨在对有上万变量的大规模多变量时间序列进行聚类。首先,将每个时刻的多变量时间序列转化成矩形网格,然后使用二维离散余弦变换对其进行特征提取。接着提出了LS相似度用于计算特征序列之间的相似程度。最后,采用层次聚类方法发现其中所蕴含的模式。实验结果显示,该方法在人工合成数据和真实数据上都有较好的效果和可扩展性。  相似文献   

11.
基于KPCA的多变量时间序列数据异常检测方法研究   总被引:1,自引:0,他引:1  
介绍了一种采用的KPCA技术获取多变量时间序列数据高维特征空间的主成方向矢量,使用主成方向矢繁内积作为异常的度量,并采用vMF分布表征主成方向矢量分布来进行多变量时间序列数据异常检测的方法;检测过程中使用历史数据训练获取分布模型的参数估计,通过计算实际数据主成方向矢量在训练模型的概率来判断异常的发生;与传统的异常检测方法相比,该方法不依赖先验的专家知识,且能够通过训练学习自动调节模型参数,可用于不同系统的异常检测中;实验表明,该方法具有较高的有效性.  相似文献   

12.
基于免疫聚类的特征数据浓缩方法   总被引:3,自引:0,他引:3  
针对诊断特征数据中重复或相似事例样本和特征参量之间可能存在的相关性,提出一种有效的特征数据双向压缩预处理方法,该法在不损失数据隐含的特征知识的前提下,能有效降低学习机器的学习负担.在进行样本参量的降维处理时,基于主元分析的思想,采用一种改进的主元分析(MPCA)方法用于横向数据压缩,在压缩样本数量时,综述和比较了现有的各种聚类算法,借鉴生物体自然免疫系统中克隆选择以及免疫网络自稳定等有关机理,提出了基于主元核相似度的免疫聚类算法用于纵向数据压缩.仿真实验验证了所提方法的有效性.  相似文献   

13.
主成份分析对高维数据进行维数约简可有效提高聚类算法的性能,但这种方法容易丢失部分对聚类具有贡献的成份.为在维数约简的同时保留对聚类具有贡献的成份,提出一种维数约简与聚类交互进行的迭代算法.每次迭代可表示为约束优化问题,并可求解此优化问题的解析解,进而给出相应的迭代聚类算法,称之为基于约束主成份分析的本文聚类.在Reuter21578、WebKB文档集上的实验结果表明,文中方法与k-均值聚类、非负矩阵分解聚类和谱聚类相比具有较好的性能.  相似文献   

14.
针对现有的聚类集成算法大都是无监督聚类集成算法且不能很好地处理高维数据的问题,设计一种基于PCA降维技术的成对约束半监督聚类集成算法(SSCEDR)。SSCEDR方法使用PCA主成分分析对原始数据进行降维,结合半监督聚类集成技术,在降维后的空间中将成对约束等先验知识代入到聚类集成过程中。本文通过在多组数据集上实验来验证算法的有效性。  相似文献   

15.
Many real world pattern classification problems involve the process and analysis of multiple variables in temporal domain. This type of problem is referred to as Multivariate Time Series (MTS) problem. It remains a challenging problem due to the nature of time series data: high dimensionality, large data size and updating continuously. In this paper, we use three types of physiological signals from the driver to predict lane changes before the event actually occurs. These are the electrocardiogram (ECG), galvanic skin response (GSR), and respiration rate (RR) and were determined, in prior studies, to best reflect a driver’s response to the driving environment. A novel Group-wise Convolutional Neural Network, MTS-GCNN model is proposed for MTS pattern classification. In our MTS-GCNN model, we present a new structure learning algorithm in training stage. The algorithm exploits the covariance structure over multiple time series to partition input volume into groups, then learns the MTS-GCNN structure explicitly by clustering input sequences with spectral clustering. Different from other feature-based classification approaches, our MTS-GCNN can select and extract the suitable internal structure to generate temporal and spatial features automatically by using convolution and down-sample operations. The experimental results showed that, in comparison to other state-of-the-art models, our MTS-GCNN performs significantly better in terms of prediction accuracy.  相似文献   

16.
为了提高高维数据集合离群数据挖掘效率,在分析了传统的离群数据挖掘算法优点和缺点的基础上,提出了一种离群聚类算法,该算法将核方法与PP主成分变换结合于离群聚类算法中,采用基于核的PP主成分变换进行数据维数消减。通过该数据变换矩阵得到相应的非线性向量,并为每个向量分配一个动态权值,在优化经典的FCM模糊聚类的目标优化迭代函数基础上,最终得到各个数据的权值,根据权值的大小标识出数据集中的离群点,理论上证明了该算法的收敛性,仿真实验的结果表明了该方法能够有效地发现高维数据集中的离群点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号