首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于斜率提取边缘点的时间序列分段线性表示方法   总被引:7,自引:0,他引:7  
本文引入解析几何中的斜率,提出了一种新颖的基于斜率提取边缘点的时间序列分段线性表示方法SEEP。对于斜率变化范围比较集中的时间序列,SEEP表示方法有着非常好的效果,与以往的分段线性表示方法相比,SEEP表示方法与原始时间序列之间的拟合误差更小,而且要小很多;对于斜率变化范围比较大的时间序列,SEEP表示方法与原始时间序列之间的拟合误差,和以往的分段线性表示方法相比,也相差不大,并且SEEP表示方法计算简单,易于实现。算法的时间复杂度仅为O(n),  相似文献   

2.
确定时间序列分段点的方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
现有的时间序列分段线性表示一般把局部极值点作为分段点,但是局部极值点并不能完全刻画时间序列的状态变化,根据时间序列线性分段的基本思想,提出在确定局部极值点的基础上引入斜率差值大的分段点,以便得到较高的拟合精度。新的分段点通过比较相邻序列段的斜率实现,斜率差值越大,该点的状态改变越明显。实验证明该方法拟合误差小,有很好的实用性。  相似文献   

3.
分段线性表示是时间序列降维的有效方法。在总结分析序列趋势变化特点的基础上,提出了一种基于趋势转折点的时间序列分段线性表示算法。首先定义了趋势转折点作为时间序列分段点的备选集,以点到区域的距离度量趋势转折点的重要性,再根据给定的阈值选择重要趋势转折点作为分段点,对时间序列进行分段线性表示。通过与其他6种方法进行实验比较,结果表明:所提方法在具有较好的拟合质量和适应能力以及对转折点明显的序列,都表现出较强的抗噪声干扰能力。  相似文献   

4.
针对目前的时间序列线性表示方法多采用启发式方法提取局部特征点作为分段点,容易陷入局部最优化,不能很好地表示时间序列全局特征,而且多采用单一的拟合误差作为阈值,不能准确预计分段数量,不利于后期进行的时间序列分析应用的问题。提出了一种新的固定分段数的表示方法——PLR_BTBU,首先根据二叉树层次遍历的思想,提取时间序列全局特征点将时间序列初始分段,再通过斜率变化特征将整个时间序列符号化,以各初始分段内的符号特征来确定各初始分段中的分段点分布,最后采用一种改进的固定分段数的自底向上融合算法,将各个子序列逐步融合到要求的分段数。实验结果表明,与已有的方法相比,该方法不仅较好地保留时间序列的全局特征,而且拟合后的时间序列和原时间序列之间的拟合误差更小。  相似文献   

5.
基于时态边缘算子的时间序列分段线性表示   总被引:2,自引:1,他引:1       下载免费PDF全文
时间序列的分段线性表示算法通常基于单一的启发式规则,难以适用于不同数据特征的时间序列。借鉴了边缘算子的思想来提取时间序列的边缘点,提出了一种基于时态边缘算子的时间序列分段线性表示算法。在来自不同领域的公开数据集上进行的实验结果表明:与两种主要的分段线性表示算法相比,该算法具有更好的拟合性能,并且更为稳定,能够适用于各类不同数据特征的时间序列。  相似文献   

6.
针对分段线性表示(即一阶线性函数表示)或分段常数表示(即零阶函数表示)在时间序列近似表示中拟合误差较大的问题,提出时间序列高阶函数分段表示方法。通过建立高阶函数候选集模型,利用拟合误差指标选取最优函数,为保证在分段点处连续,引入断点处约束条件;在分段点选取方式上,设定观测值变化阈值及分段区间阈值,保证压缩率的同时,保留重要点信息。实验结果表明,该算法相对于分段线性表示和分段常数表示,能更好地拟合原始序列。  相似文献   

7.
时间序列的特征表示与相似性度量是时间序列数据挖掘的重要基础。针对现有的序列表示方法难以具体反映序列的形态变化趋势,导致相似度量结果不精确的问题,提出一种新的基于形态模式的相似性度量算法。该算法在分段线性表示的基础上,根据序列在不同时段的斜率变化情况,划分序列的分段形态模式并用特殊的字符进行表示,把时间序列转换成字符串序列,利用最长公共子序列方法计算字符串序列的距离作为时间序列之间的距离。最后通过实验验证该方法的有效性。理论分析和实验证明该方法对数据点的值不敏感,能够减少噪声的干扰,而且具有较高的准确性。  相似文献   

8.
时间序列数据的分段线性表示   总被引:2,自引:0,他引:2  
在时间序列分段线性表示(PLR)基础上,提出一种新的基于特征点的分段方法,克服采用单一误差算法的模型失配问题,更加准确地反映过程状态的变化.  相似文献   

9.
一种基于信息熵的时间序列分段线性表示方法   总被引:1,自引:0,他引:1  
针对部分时间序列具有高维、大数据量及数据更新速度较快的特点, 导致在原始时间序列上难以进行数据挖掘的问题, 提出一种基于信息熵的时间序列分段线性表示方法——PLR_IE。该算法利用信息熵作为评判重要点数量的性能指标, 从序列中提取重要分段点的数量分布情况, 利用重要点组成的序列重新拟合原始时间序列, 为下一步数据挖掘提供基础。实验结果表明, 该方法能高效地提取出序列主要特征、拟合原始序列。  相似文献   

10.
实际过程中采集到的时间序列数据通常是海量数据,在原时间序列数据上直接进行数据挖掘的效率通常是低下的,有时甚至不可行,因此就须将时间序列在更高的层次上进行表示。借鉴时间序列线性分段的基本思想,提出了一种自适应误差约束的分段线性表示方法,该方法在查找出时间序列特殊点的基础上,通过给定误差e进行调节,可以自动地产生拟合线段的数目。不仅可以压缩数据,去除噪声,还能得到时间序列的模式变化特征。与一般的分段线性表示相比,文中方法的拟合误差更小,适应能力更强。  相似文献   

11.
草图信息的存储与传输是草图系统在信息共享乃至网络协同方面需要解决的问题,其核心在于草图信息的一致表示。本文从信息表示和信息传榆两个维度,建立了草图信息表示模型框架。该框架采用域模型思想,包括域属性、逻辑模型、转换模型、对象模型和控制模型,它们实现了草图信息的一致表示、统一管理和信息存储、传输。最后,从静态和动态两方面,对草图信息的建模过程进行了详细描述,给出了草图信息表示的 XML 实现策略,并对信息传输技术进行了分析。  相似文献   

12.
通过ISO 13584实现不同 CAD系统间标准零部件库的交换   总被引:1,自引:0,他引:1  
金俏慧  张申生  杨东 《计算机工程》2000,26(4):18-19,59
目前,许多商品化的CAD系统中均配有零部件库加速产品的开发。但零部件库的数据据式不尽相同,在这在一定程度上阻碍了不同CAD系统之间标准件库的零件数据交换和标准件的共享。该文通过采用ISO13584国际标准,提出了一种在两个不同CAD系统间进行零件部件数据交换技术和具体实现方式。  相似文献   

13.
基于SEDRIS的综合战场环境数据表示模型   总被引:1,自引:0,他引:1  
一致性的战场数据表示机制和无缝的数据共享机制是决定建模仿真可信度的关键因素,综合环境数据表示和交换规范SEDRIS为解决这个问题提供了很好的技术支持。本文首先归纳了SEDRIS的相关基本概念,分析了综合战场环境的必要的构成要素,在此基础上提出了一个包含自然和人文特征的环境要素和作战实体外部特征的概念模型,基于SEDRIS给出了两种代表性要素的数据表示模型,利用DRM模型对综合战场环境中的地形元素与坦克作战元素进行统一的无歧义的UML建模,最后提出了如何利用SEDRIS对概念模型进行有效描述,显示了SEDRIS模型在综合战场环境数据表示方面的效率性。  相似文献   

14.
时序数据挖掘中的数据表示算法   总被引:1,自引:0,他引:1  
针对时序数据挖掘中常见数据表示算法的缺陷,提出了基于关键点的误差检验分段算法。该算法首先提出了关键点的概念,接着设计了具有明确物理意义的关键点平滑公式。在此基础上,分析了传统算法在分段误差控制过程上存在的问题,提出利用中位数控制分段拟合误差的思想。最后进行了数据实验。  相似文献   

15.
曹翰林  唐海娜  王飞  徐勇军 《软件学报》2021,32(5):1461-1479
基于地理位置信息的应用和服务的迅速发展对轨迹数据挖掘提出新的需求和挑战.原始轨迹数据通常是由坐标-时间戳元组构成的有序序列组成,而现有的大多数数据分析算法均要求输入数据位于向量空间中.因此,为了将轨迹数据从变长的坐标-时间戳序列转化定长的向量表示且保持原有的特征,对轨迹数据进行有效的表示是十分重要且必要的一步.传统的轨迹表示方法多是基于人工设计特征,通常仅将轨迹表示作为数据预处理的一部分.随着深度学习的兴起,这种从大规模数据中学习的能力使得基于深度学习的轨迹表示方法相较于传统方法取得了巨大的效果提升,并赋予了轨迹表示更多的可能性.本文对轨迹表示领域中的研究进展进行了全面的总结,将轨迹表示按照研究对象的不同尺度归纳为对轨迹单元的表示和对整条轨迹的表示两大类别,并在每种类别下对不同原理的方法进行了对比分析.其中重点分析了基于轨迹点表示的关键方法,也对近年来广泛使用的基于神经网络的轨迹表示的研究成果做了系统的归类.此外本文介绍了基于轨迹表示的关键应用,最后对轨迹表示领域的未来研究方向进行了展望.  相似文献   

16.
Massive ocean data acquired by various observing platforms and sensors poses new challenges to data mana-gement and utilization.Typically,it is difficult to find the desired data from the large amount of datasets efficiently and effectively.Most of existing methods for data discovery are based on the keyword retrieval or direct semantic reasoning,and they are either limited in data access rate or do not take the time cost into account.In this paper,we creatively design and implement a novel system to alleviate the problem by introducing semantics with ontologies,which is referred to as Data Ontology and List-Based Publishing (DOLP).Specifically,we mainly improve the ocean data services in the following three aspects.First,we propose a unified semantic model called OEDO (Ocean Environmental Data Ontology) to represent heterogeneous ocean data by metadata and to be published as data services.Second,we propose an optimized quick service query list (QSQL) data structure for storing the pre-inferred semantically related services,and reducing the service querying time.Third,we propose two algorithms for optimizing QSQL hierarchically and horizontally,respectively,which aim to extend the semantics relationships of the data service and improve the data access rate.Experimental results prove that DOLP outperforms the benchmark methods.First,our QSQL-based data discovery methods obtain a higher recall rate than the keyword-based method,and are faster than the traditional semantic method based on direct reasoning.Second,DOLP can handle more complex semantic relationships than the existing methods.  相似文献   

17.
基于本体的电网运行知识库构建与研究   总被引:1,自引:0,他引:1       下载免费PDF全文
喻洁  王磊  夏安邦 《计算机应用研究》2008,25(12):3614-3646
将本体的概念引入电力领域知识表达,构建了一个可以被各业务系统所共享的电网运行知识库。通过具有事件引擎的本体知识链结构,将物理本体与事件本体有机结合,基于语义和逻辑顺序客观描述了电网运行的静态和动态特性。知识库中的事件引擎检索方式极大提高了信息查询的效率。  相似文献   

18.
在现有的SIMD程序设计中,编译器或程序员都需要借助置换指令对参与运算的向量操作数进行重新组织,才能符合SIMD指令的要求。这些置换指令带来了较大的性能损失。本文提出了一种新的中间表示,它能够完整地记录标量和向量操作数的存储地址信息,使得置换指令的产生尽可能地推后,减少了冗余置换指令的产生。利用这种中间表示实现了一种数据置换操作的优化算法,它能够有效地减少置换指令带来的性能损失。面向一组典型的多媒体程序进行测试的结果表明,本文提出的方法可以平均获得7%的性能加速。  相似文献   

19.
软件工程数据挖掘研究进展   总被引:5,自引:0,他引:5  
随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战;详细评述了在软件工程各个阶段,数据挖掘技术所能发现的信息/知识,以及获取这些信息/知识的意义、难点、步骤和方法,重点介绍了数据预处理和数据表示方法;对软件工程数据挖掘研究的发展趋势进行了展望。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号