共查询到20条相似文献,搜索用时 0 毫秒
1.
分类问题是数据挖掘中的基本问题之一,时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础。SAX方法是一种典型的时间序列符号化表示方法,在采用该方法的基础上对时间序列进行分类,不仅可以有效地降维、降噪,而且具有简单、直观等特点,但是该方法有可能造成信息损失并影响到分类结果的准确性。为了弥补信息损失对分类结果的影响,采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失,从而提高整个分类器的效率。针对一些样本在BOP表示中都损失了相似的重要信息,以至于大多数投票无法进一步提高分类效率的问题,进一步提出了结合集成学习中AdaBoost算法,通过对训练样本权重的调整,从而达到以提高分类器性能来弥补信息损失的效果。实验结果表明,将BOP方法与集成学习相结合的方法框架,不仅能很好地处理SAX符号化表示中的信息损失问题,而且与已有方法相比,在分类准确度方面也有显著的提高。 相似文献
2.
3.
时间序列数据广泛存在于工业、医疗等应用领域的分布式边缘设备中,由于其往往具备人类不可识别的特征,基于现实数据的时间序列分类任务中普遍存在数据“孤岛”和标注错误等问题.为解决分布式数据环境下这一困难,提出一种联邦时序过滤框架,该框架充分考虑自监督对比学习在提取复杂时序数据表征的优越性,并结合联邦学习方法来解决分布式系统的隐私安全问题,同时降低通信成本.首先,通过在服务器上维护一套基准样本,使用基于区别对比损失和预测对比损失的时序增强预监督策略,通过预训练-微调方法获得一个高泛化时间序列表征能力的预监督模型;然后,引入一种新的标签噪声过滤的方法,利用由预监督模型指导的伪标签与本地标注的标签协同过滤设备中的噪声数据,并将干净数据集用于全局模型的训练;最后,根据各种标签噪声下对框架进行有效性验证,验证不同基准数据比例对于所构造框架的影响,并通过消融实验验证预监督模型各损失的过滤效果. 相似文献
4.
基于SAX方法的股票时间序列数据相似性度量方法研究 总被引:2,自引:0,他引:2
特定数据集上高效的相似性度量方法是目前时间序列数据挖掘领域研究的重点内容之一。针对经过SAX方法降维后的股票数据在相似性度量中缺乏趋势变化的动态信息这一问题,本文提出了一种融合了点距离与模式距离优点的新型相似性度量函数——复合距离函数,并通过实证分析验证了该距离函数在相似性度量中的有效性,为揭示股票数据间相互依赖的规律以及时间序列相似性问题的进一步研究提供了新思路。 相似文献
5.
6.
7.
桑基图在工业、能源以及金融货币的流程图中起到很重要的作用,它能够用非常活泼生动的方式展现能源利用以及能源流向信息。本文创新性的提出了一种用桑基图来展现时间序列文本数据的可视化方法。这种方法不仅仅能够突破桑基图在不同领域中的应用场景,还能够理想的对时间序列的数据进行展现,使得展现的数据美丽的且带有趣味性。使用具体的金融文本数据集对提出方法进行了验证,证明了该方法能够对时间序列文本数据进行清晰的表达,对隐含的知识能够有效的挖掘,具有很好的实用性。 相似文献
8.
9.
现有时间序列分类方法普遍基于一种循环网络结构解决时间序列点值耦合问题,无法并行计算,导致计算资源浪费,因此提出一种增强局部注意力的时间序列分类方法.该方法拟合混合距离信息以增加时间序列位置感知能力,将混合距离信息融入自注意矩阵计算中,从而扩展自注意力机制;构造多尺度卷积注意力获取多尺度局部前向信息,以解决标准自注意力机制基于点值计算存在注意力混淆的问题;使用改进后的自注意力机制构造时序自注意分类模块,并行计算处理时间序列分类任务.实验结果表明,与现有时间序列分类方法相比,基于局部注意力增强的时间序列分类方法能够加速收敛,有效提高时序序列分类效果. 相似文献
10.
针对新一代航天发射任务快速准备、快速装订、快速切换以及指挥、保障场景的多元呈现、动态构建的实时性特点,提出了一种可视化应用拓扑建模方法。通过制定一套统一的数据和逻辑交互接口,设计了一种用户自定义场景建模和应用软件自编程方法。该方法将场景元素抽象为数据驱动的逻辑、拟物两类图元库,提供统一架构的图元编辑和处理平台,能够自动生成场景配置文件,快速加载到业务系统。通过应用验证,基于此方法构建的可视化建模方法能够基于历史任务快速构建新型号、新任务场景页面,既改变了以前只能静态或者有限动态的展示模式,又提高了航天任务准备效率。 相似文献
11.
面向相似性搜索的时间序列表示方法述评 总被引:6,自引:0,他引:6
时间序列作为一种数据形式,广泛存在于各种商业、医学、工程、自然科学和社会科学等数据库中。近年来,时间序列的相似性搜索问题正得到越来越多的重视。该问题可描述为给定某个的时间序列,要求从一个大型时间序列数据库中找出与之最相似的序列。该问题的有效求解涉及到两个关键难点,即相似性度量的定义和搜索算法的时间复杂度,而这两者都依赖于时间序列的近似表示方法。因此,通过详细评述面向相似性搜索的各种时间序列近似表示方法,对这些方法进行分析和比较,总结了这些方法的优点和不足,并对进一步的研究方向作出了预测。 相似文献
12.
一、引言自然界以及我们社会生活中的各种事物都在运动、变化和发展着,将它们按时间顺序记录下来,我们就可以得到各种各样的“时间序列”数据。对时间序列进行分析,可以揭示事物运动、变化和发展的内在规律,对于人们正确认识事物并据此作出科学的决策具有重要的现实意义。 相似文献
13.
时间序列分类即通过构建分类模型建模时间序列中的特征来实现对该时间序列的归类,是时间序列挖掘的重要研究分支。现有的时间序列分类方法多数从时域的角度对时间序列进行建模,忽视了时间序列中隐含的频域信息,而时间序列往往同时蕴含着多种不同变化速率的变化模式,这些变化模式在时域上相互叠加,使得时间序列的变化规律变得比较复杂,因此仅从时域的角度进行建模,难以有效地从复杂的规律中捕获其蕴含的多种相对简单的规律。提出一种基于自适应多级小波分解的神经网络方法AMWDNet,使用自适应小波分解建模时间序列中的多级时频信息,自适应小波分解模块能够同时从时域和频域的角度出发,对时间序列中蕴含的多种变化模式进行有效分解,通过使用长短期时间模式提取模块分别建模时间序列中的长期和短期时间模式。选取时间序列分类任务中8个主流的方法作为基准方法,在UCR数据集仓库中的8个数据集上进行对比实验,结果表明,AMWDNet在其中的7个数据集上取得了最高的分类准确率,相比于次优的基准方法提升了0.1~2.2个百分点,整体分类性能优于MLP和FCN等基准方法。 相似文献
14.
《计算机应用》2024,45(2)
时间序列分类是时间序列分析的基础。然而;现有的时间序列分类方法对应的形态特征并不能作为分类依据;且通道间的特征通过图上的单一权重刻画不够准确;导致分类精度不高。因此;提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。首先;在时间序列上构建时间序列事件集合后;根据每个时间序列事件构建突变图、协同图、启发图;以减少噪声对高维特征的干扰;其次;融合多图的特征作为衍生特征;并抽取时间序列事件的多个时间级别的特征;最后;提出一种融合衍生特征的多图卷积分类模型级联时间序列和图特征作为时间序列事件的高维特征。实验结果表明;与TF-C(Time-Frequency Consistency)和BiLSTM+隐马尔可夫模型(Bi-directional Long Short-Term Memory-Hidden Markov Model; BL-HMM)方法相比;TSEC-FDF在4个真实数据集上的准确率、精确率、查全率、F1值、AUROC(Area Under the Receiver Operating Characteristic curve)以及AUPRC(Area Under the Precision versus Recall Curve)至少提升了3.2%、4.7%、7.8%、6.3%、0.9%和2.2%。 相似文献
15.
张翰林;王俊陆;宋宝燕 《计算机应用》2025,(2):428-435
时间序列分类是时间序列分析的基础。然而,现有的时间序列分类方法对应的形态特征并不能作为分类依据,且通道间的特征通过图上的单一权重刻画不够准确,导致分类精度不高。因此,提出一种融合衍生特征的时间序列事件分类方法(TSEC-FDF)。首先,在时间序列上构建时间序列事件集合后,根据每个时间序列事件构建突变图、协同图、启发图,以减少噪声对高维特征的干扰;其次,融合多图的特征作为衍生特征,并抽取时间序列事件的多个时间级别的特征;最后,提出一种融合衍生特征的多图卷积分类模型级联时间序列和图特征作为时间序列事件的高维特征。实验结果表明,与TF-C(Time-Frequency Consistency)和BiLSTM+隐马尔可夫模型(Bi-directional Long Short-Term Memory-Hidden Markov Model, BL-HMM)方法相比,TSEC-FDF在4个真实数据集上的准确率、精确率、查全率、F1值、AUROC(Area Under the Receiver Operating Characteristic curve)以及AUPRC(Area Under the Precision versus Recall Curve)至少提升了3.2%、4.7%、7.8%、6.3%、0.9%和2.2%。 相似文献
16.
时间事件序列数据,是由一个或多个记录构成的集合,每个记录由一组带有时间戳的事件类别组成.数据可视化被广泛用于时间事件序列数据的频繁模式发现、相似模式匹配与查询以及潜在阶段模式检测.文中介绍了时间事件序列数据的特征,并重点从时间事件序列数据的可视化呈现方法和可视分析2个方面对已有的工作进行了系统的整理.在可视化呈现方式上,将现有的可视化方法分为4个类别,即基于GanttChart、基于Flow、基于StoryLines及基于矩阵的可视化方法,并分别介绍了相关类别的可视化方法的发展;将可视分析任务总结为4类主要任务,即模式发现与探索、可视化查询、对比分析及结果事件分析,并且从这些可视分析任务的角度总结了现有的可视分析工具.最后,对时间事件序列数据可视化面临的挑战以及未来趋势进行了总结和展望,以期为时间事件序列数据分析提供新的思路. 相似文献
17.
18.
19.
时间序列事件聚类是研究事件分类及挖掘分析的基础.现有聚类方法多直接针对具有时间属性且结构复杂的持续事件聚类,未考虑聚类对象的转化,聚类准确性低且效率差.针对这些问题,提出一种面向时间序列事件的动态矩阵聚类方法RDMC.首先,构建事件近邻评价体系,根据评价值优劣衡量事件的代表性,通过近邻评分的后向差分计算策略构建RDS候... 相似文献
20.
伪周期时间序列是一种广泛存在的数据形式,它具有伪周期性、非平稳性和特征值等特征。对这类时间序列进行预测,具有很强的研究和应用意义。然而,目前的相关研究对伪周期时间序列的关注度不足,一些已有的时间序列预测方法在应用到伪周期时间序列上时,会造成误差的累积,使得预测效果很差。为了解决这些问题,总结了伪周期时间序列的特征,并提出了SPG-Suite预测方法,很好地解决了传统方法无法解决的问题。最后,在真实的数据集上进行了实验,并与传统方法进行了对比,实验结果表明,SPG-Suite方法在预测精度上具有明显的优势,并具有较强的可扩展性。 相似文献