首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
符号聚合近似表示法是提取时间序列特征的重要方式。然而,传统的符号聚合近似表示法存在平均化分段数、同等对待划分区间,以及无法准确反映非平稳序列的突变信息等多项缺陷。鉴于此,通过引入局部均值分解和改进小波熵的分段算法,建立了一种新的时序SAX模型。该模型的基本原理是采用局部均值分解技术对原始序列进行去噪处理,利用滑动窗口阈值法获取分段数,并使用SAX表示法进行符号表示,利用KNN分类器实现分类性能测试。基于这一改进模型,进行了实证检验,实验结果表明,该模型能够有效提取序列的信息特征,具有较高的拟合度,达到了降维的目的,更重要的是,提高了KNN分类算法在SAX表示法中分类的准确率。  相似文献   

2.
针对时间序列数据降维过程中易丢失趋势特征信息的问题,提出一种基于趋势特征的时间序列符号聚集近似表示方法,除保留各序列分段的均值特征外,采用分段的趋势距离因子及趋势形态因子共同描述序列趋势特征;并给出了满足下界密封性的距离度量方法,从而更好地表示具有不同趋势特征的时间序列。在公共数据集上的实验结果表明,该方法在分类误报率、降维比率等方面比符号聚集近似方法(SAX)和基于趋势距离的时间序列符号近似表示方法(SAX_TD)有10%以上的下降,并具有更好的下界密封性。实验结果证明,该算法在进行时间序列压缩的同时充分保留时间序列的趋势变化形态,从而提高时间序列数据挖掘的效率。  相似文献   

3.
提出了一种时序符号化方法.根据数据集极值来确定最佳字符集及时序数据的划分基准,通过估算最大压缩比来指导降维,从而实现了与SAX同样的符号化时序转换和相同的距离计算方式.与SAX不同的是,该时序符号化方法可以有效防止极值信息的丢失,因而在一些与极值相关的时序分析中有出色的表现.  相似文献   

4.

提出了一种时序符号化方法. 根据数据集极值来确定最佳字符集及时序数据的划分基准,通过估算最大压缩比来指导降维,从而实现了与SAX 同样的符号化时序转换和相同的距离计算方式 .与 SAX不同的是,该时序符号化方法可以有效防止极值信息的丢失,因而在一些与极值相关的时序分析中有出色的表现.

  相似文献   

5.
为了有效地解决传统的基于向量表示的文档维数降维算法存在的维数灾难和奇异值问题,提出了基于张量最大间隔投影的Web文档分类算法,该算法能够在维数降维的过程中充分利用文档的结构和关联信息来提高算法的分类鉴别能力,在WebKB和20NG数据集上的实验结果表明该算法优于其他常用的的文档分类算法。  相似文献   

6.
基于统计特征的时序数据符号化算法   总被引:9,自引:0,他引:9  
为克服SAX(符号聚合近似)算法对时序信息描述不完整的缺陷,提出基于统计特征的时序数据符号化算法,与SAX不同的是,该算法将时序符号看作矢量,而各时序子段的均值和方差则分别作为描述其平均值及发散程度的分量.由于该算法能够比SAX提供更多的描述信息,因而在时序数据挖掘应用中能够获得比SAX更精确的结果.大量的实验也证实了它的出色表现.  相似文献   

7.
梁衡 《福建电脑》2012,28(6):47-48
数据降维主要是为了解决维数灾害问题。该论文主要分析了三种数据降维方法,并对算法优缺点进行了分析和比较。  相似文献   

8.
由于高维特征空间通常会导致不适定问题,针对高光谱影像的统计模式识别是非常艰巨的任务。随着波段数目的增加,高光谱影像分析则面临Hughes现象等障碍,因此促进了降维方法的发展,它能够有效处理有限训练样本下的高维数据集情形。降维算法的目标是在保持原始数据主要本征信息的同时获取高维数据样本的低维表示。为了能够有效解决高光谱影像分析中的"维数灾难"问题,从而改进后续计算复杂度,我们引入一种半监督局部保持的降维算法。  相似文献   

9.
由于时间序列数据具有高维性等特征,不易直接进行挖掘.在对时间序列数据进行挖掘之前通常先进行特征表示达到降维的目的,分段聚合近似表示(PAA)是特征表示方法中比较常用的一种,针对PAA算法对每一区间有平均对待的缺点,提出一种采用小波熵的时间序列分段聚合近似表示,将小波熵运用到PAA算法的改进中,把某一区间内的小波能量熵值作为判评区间复杂度的指标,按各区间内小波熵值的比重分配各区间内分段数,实现对复杂区间详细描述,对相对平稳区间粗略逼近,利用matlab平台仿真证明,上述方法在压缩比相同的情况下比PAA方法更好地拟合原始序列,不仅能对时间序列有效地降维,而且能使近似更加精确,进而实现时间序列数据挖掘效率的提高.  相似文献   

10.
移动对象位置预测是基于位置服务的重要组成部分。现有的移动对象位置预测算法有基于马尔可夫链的算法、基于隐马尔可夫模型的算法、基于神经网络的算法等,然而这些算法都无法解决移动对象轨迹数据中位置过多带来的维数灾难问题。为了解决这一问题,提出了位置分布式表示模型(location distributed representation model,LDRM)。该模型将难以处理的表示位置的高维one-hot向量降维成包含移动对象运动模式的低维位置嵌入向量。随后,将该模型与基于长短期记忆网络(long short-term memory,LSTM)的位置预测算法结合为LDRM-LSTM移动对象位置预测算法。真实数据集上的实验表明,与现有算法相比LDRM-LSTM算法在预测准确性上有较大的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号