共查询到20条相似文献,搜索用时 15 毫秒
1.
分类问题是数据挖掘中的基本问题之一,时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础。SAX方法是一种典型的时间序列符号化表示方法,在采用该方法的基础上对时间序列进行分类,不仅可以有效地降维、降噪,而且具有简单、直观等特点,但是该方法有可能造成信息损失并影响到分类结果的准确性。为了弥补信息损失对分类结果的影响,采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失,从而提高整个分类器的效率。针对一些样本在BOP表示中都损失了相似的重要信息,以至于大多数投票无法进一步提高分类效率的问题,进一步提出了结合集成学习中AdaBoost算法,通过对训练样本权重的调整,从而达到以提高分类器性能来弥补信息损失的效果。实验结果表明,将BOP方法与集成学习相结合的方法框架,不仅能很好地处理SAX符号化表示中的信息损失问题,而且与已有方法相比,在分类准确度方面也有显著的提高。 相似文献
2.
3.
基于SAX方法的股票时间序列数据相似性度量方法研究 总被引:2,自引:0,他引:2
特定数据集上高效的相似性度量方法是目前时间序列数据挖掘领域研究的重点内容之一。针对经过SAX方法降维后的股票数据在相似性度量中缺乏趋势变化的动态信息这一问题,本文提出了一种融合了点距离与模式距离优点的新型相似性度量函数——复合距离函数,并通过实证分析验证了该距离函数在相似性度量中的有效性,为揭示股票数据间相互依赖的规律以及时间序列相似性问题的进一步研究提供了新思路。 相似文献
4.
5.
桑基图在工业、能源以及金融货币的流程图中起到很重要的作用,它能够用非常活泼生动的方式展现能源利用以及能源流向信息。本文创新性的提出了一种用桑基图来展现时间序列文本数据的可视化方法。这种方法不仅仅能够突破桑基图在不同领域中的应用场景,还能够理想的对时间序列的数据进行展现,使得展现的数据美丽的且带有趣味性。使用具体的金融文本数据集对提出方法进行了验证,证明了该方法能够对时间序列文本数据进行清晰的表达,对隐含的知识能够有效的挖掘,具有很好的实用性。 相似文献
6.
基于特征的时间序列数据场可视化方法 总被引:3,自引:0,他引:3
本文给出了一种在与时间有关的多时间片序列数据场中抽取特征并进行可视化的方法.首先讨论了特征可视化的一般概念,给出了数据场中特征的定义及特征可视化的基本方法.提出了一个在二维数据场中进行特征边界跟踪的方法,采用2个边界算子抽取边界,用树形结构表示特征边界之间的关系,用Fourier描述器描述特征边界并重构.最后,讨论了算法的实现及有关问题. 相似文献
7.
现有时间序列分类方法普遍基于一种循环网络结构解决时间序列点值耦合问题,无法并行计算,导致计算资源浪费,因此提出一种增强局部注意力的时间序列分类方法。该方法拟合混合距离信息以增加时间序列位置感知能力,将混合距离信息融入自注意矩阵计算中,从而扩展自注意力机制;构造多尺度卷积注意力获取多尺度局部前向信息,以解决标准自注意力机制基于点值计算存在注意力混淆的问题;使用改进后的自注意力机制构造时序自注意分类模块,并行计算处理时间序列分类任务。实验结果表明,与现有时间序列分类方法相比,基于局部注意力增强的时间序列分类方法能够加速收敛,有效提高时序序列分类效果。 相似文献
8.
针对新一代航天发射任务快速准备、快速装订、快速切换以及指挥、保障场景的多元呈现、动态构建的实时性特点,提出了一种可视化应用拓扑建模方法。通过制定一套统一的数据和逻辑交互接口,设计了一种用户自定义场景建模和应用软件自编程方法。该方法将场景元素抽象为数据驱动的逻辑、拟物两类图元库,提供统一架构的图元编辑和处理平台,能够自动生成场景配置文件,快速加载到业务系统。通过应用验证,基于此方法构建的可视化建模方法能够基于历史任务快速构建新型号、新任务场景页面,既改变了以前只能静态或者有限动态的展示模式,又提高了航天任务准备效率。 相似文献
9.
一、引言自然界以及我们社会生活中的各种事物都在运动、变化和发展着,将它们按时间顺序记录下来,我们就可以得到各种各样的“时间序列”数据。对时间序列进行分析,可以揭示事物运动、变化和发展的内在规律,对于人们正确认识事物并据此作出科学的决策具有重要的现实意义。 相似文献
10.
面向相似性搜索的时间序列表示方法述评 总被引:6,自引:0,他引:6
时间序列作为一种数据形式,广泛存在于各种商业、医学、工程、自然科学和社会科学等数据库中。近年来,时间序列的相似性搜索问题正得到越来越多的重视。该问题可描述为给定某个的时间序列,要求从一个大型时间序列数据库中找出与之最相似的序列。该问题的有效求解涉及到两个关键难点,即相似性度量的定义和搜索算法的时间复杂度,而这两者都依赖于时间序列的近似表示方法。因此,通过详细评述面向相似性搜索的各种时间序列近似表示方法,对这些方法进行分析和比较,总结了这些方法的优点和不足,并对进一步的研究方向作出了预测。 相似文献
11.
时间序列分类即通过构建分类模型建模时间序列中的特征来实现对该时间序列的归类,是时间序列挖掘的重要研究分支。现有的时间序列分类方法多数从时域的角度对时间序列进行建模,忽视了时间序列中隐含的频域信息,而时间序列往往同时蕴含着多种不同变化速率的变化模式,这些变化模式在时域上相互叠加,使得时间序列的变化规律变得比较复杂,因此仅从时域的角度进行建模,难以有效地从复杂的规律中捕获其蕴含的多种相对简单的规律。提出一种基于自适应多级小波分解的神经网络方法AMWDNet,使用自适应小波分解建模时间序列中的多级时频信息,自适应小波分解模块能够同时从时域和频域的角度出发,对时间序列中蕴含的多种变化模式进行有效分解,通过使用长短期时间模式提取模块分别建模时间序列中的长期和短期时间模式。选取时间序列分类任务中8个主流的方法作为基准方法,在UCR数据集仓库中的8个数据集上进行对比实验,结果表明,AMWDNet在其中的7个数据集上取得了最高的分类准确率,相比于次优的基准方法提升了0.1~2.2个百分点,整体分类性能优于MLP和FCN等基准方法。 相似文献
12.
13.
时间事件序列数据,是由一个或多个记录构成的集合,每个记录由一组带有时间戳的事件类别组成.数据可视化被广泛用于时间事件序列数据的频繁模式发现、相似模式匹配与查询以及潜在阶段模式检测.文中介绍了时间事件序列数据的特征,并重点从时间事件序列数据的可视化呈现方法和可视分析2个方面对已有的工作进行了系统的整理.在可视化呈现方式上,将现有的可视化方法分为4个类别,即基于GanttChart、基于Flow、基于StoryLines及基于矩阵的可视化方法,并分别介绍了相关类别的可视化方法的发展;将可视分析任务总结为4类主要任务,即模式发现与探索、可视化查询、对比分析及结果事件分析,并且从这些可视分析任务的角度总结了现有的可视分析工具.最后,对时间事件序列数据可视化面临的挑战以及未来趋势进行了总结和展望,以期为时间事件序列数据分析提供新的思路. 相似文献
14.
15.
伪周期时间序列是一种广泛存在的数据形式,它具有伪周期性、非平稳性和特征值等特征。对这类时间序列进行预测,具有很强的研究和应用意义。然而,目前的相关研究对伪周期时间序列的关注度不足,一些已有的时间序列预测方法在应用到伪周期时间序列上时,会造成误差的累积,使得预测效果很差。为了解决这些问题,总结了伪周期时间序列的特征,并提出了SPG-Suite预测方法,很好地解决了传统方法无法解决的问题。最后,在真实的数据集上进行了实验,并与传统方法进行了对比,实验结果表明,SPG-Suite方法在预测精度上具有明显的优势,并具有较强的可扩展性。 相似文献
16.
面向相似性查询的时间序列距离度量方法述评 总被引:1,自引:0,他引:1
从一元时间序列和多元时间序列两个方面对当前提出的主要时间序列距离度量方法进行了述评.深入分析了各种算法的原理和特点,比较了算法对时间序列形变的支持情况以及时间复杂度.从客观上讲,各种算法之间并不具有绝对的优劣关系,每种算法的原理和特点各异,适用的问题领域也不一样.对于工程应用中选择时间序列距离度量方法具有指导意义,同时对于设计新的距离度量方法也具有参考价值. 相似文献
17.
时间序列事件聚类是研究事件分类及挖掘分析的基础.现有聚类方法多直接针对具有时间属性且结构复杂的持续事件聚类,未考虑聚类对象的转化,聚类准确性低且效率差.针对这些问题,提出一种面向时间序列事件的动态矩阵聚类方法RDMC.首先,构建事件近邻评价体系,根据评价值优劣衡量事件的代表性,通过近邻评分的后向差分计算策略构建RDS候... 相似文献
18.
时间序列数据通常是指一系列带有时间间隔的实值型数据,广泛存在于煤矿、金融和医疗等领域。为解决现有时间序列数据分类问题中存在的含有大量噪声、预测精度低和泛化性能差的问题,提出了一种基于正则化极限学习机(RELM)的时间序列数据加权集成分类方法。首先,针对时间序列数据中所含有的噪声,利用小波包变换方法对时间序列数据进行去噪处理。其次,针对时间序列数据分类方法预测精度低、泛化性能较差的问题,提出了一种基于RELM的加权集成分类方法。该方法通过训练正则化极限学习机(RELM)隐藏层节点数量的方法,有效选取RELM基分类器;通过粒子群优化(PSO)算法,对RELM基分类器的权值进行优化;实现对时间序列数据的加权集成分类。实验结果表明,该分类方法能够对时间序列数据进行有效分类,并提升了分类精度。 相似文献
19.
时间弯曲距离受最优路径和距离计算方式限制,累加距离不能有效区分时间序列的类型。标识极值能够获得时间序列的区间性特征,相应的特征标识能够对距离相同但趋势不同的时间序列进行有效分类。提出分析同类时间序列的时间弯曲距离结果获得典型时间序列,根据极值点进行分段,在标准差的基础上形成特征标识。对达到距离要求的目标时间序列和典型时间序列进行标识匹配,最终明确其类型。所提算法解决了时间序列分类过程中时间弯曲距离度量局限性的问题。最后,证明了算法的理论可行性,并给出了其整体流程。实验结果表明,基于极值分段特征标识的时间序列分类方法具有良好的分类性能。 相似文献
20.
基于多样化top-k shapelets转换的时间序列分类方法 总被引:1,自引:0,他引:1
针对基于shapelets转换的时间序列分类方法中候选shapelets存在较大相似性的问题,提出一种基于多样化top-k shapelets转换的分类方法DivTopKShapelet。该方法采用多样化top-k查询技术,去除相似shapelets,并筛选出最具代表性的k个shapelets集合,最后以最优shapelets集合为特征对数据集进行转换,达到提高分类准确率及时间效率的目的。实验结果表明,DivTopKShapelet分类方法不仅比传统分类方法具有更高的准确率,而且与使用聚类筛选的方法(ClusterShapelet)和shapelets覆盖的方法(ShapeletSelection)相比,分类准确率最多提高了48.43%和32.61%;同时在所有15个数据集上均有计算效率的提升,最少加速了1.09倍,最高可达到287.8倍。 相似文献