首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
李建勋  马美玲  郭建华  严峻 《计算机应用》2019,39(10):2955-2959
针对符合一定数据模式或规律的虚假数据识别问题,提出一种基于随机性分析的虚假趋势时间序列判别方法。该方法在分析时间序列组成的基础上,首先探索虚假趋势时间序列的简单伪造和复杂伪造方式,并将其分解为虚假趋势和虚假随机两部分;然后通过基函数逼近进行时间序列虚假趋势部分的提取,采用随机性理论开展虚假随机部分的分析;最终借助单比特频数和块内频数对虚假随机部分是否具备随机性进行检测,为具有一定趋势特征的虚假时间序列的判别提供了一个解决方案。实验结果表明:该方法能够有效地分解虚假时间序列和提取虚假趋势部分,实现简单伪造数据和复杂伪造数据的判别,支持对通过观测手段或者检测设备所获取的数值型数据的真伪分析,进一步提高了虚假数据可判别范围,平均判别正确率可达74.7%。  相似文献   

2.
粗集理论对股票时间序列的知识发现   总被引:3,自引:0,他引:3  
提出了将粗集理论应用于时间序列的知识发现。知识发现的过程包括时间序列数据预处理、属性约简和规则抽取三部分。其中数据预处理主要用信号处理技术清洗数据,然后将清洗后的时间序列按照某个变量的变化趋势进行分割,分割后每个时间段内的变化趋势不变,从而将时间序列转换成为一系列静态模式(每种模式代表一种行为趋势),从而去掉其时间依赖性。把决定各种模式的相关属性抽取出来组成一个适用于粗集理论的信息表,然后采用粗集理论对信息表进行属性约简和规则抽取,所得到的规则可以用于预测时间序列在未来的行为。最后将该方法用于股票的趋势预测,取得良好效果。  相似文献   

3.
为提高时间序列相似匹配的精度和效率,提出一种基于小波包变换的时间序列相似匹配算法.首先利用小波包可对信号进行精细分析的特点,对时间序列进行维数约简,用变换后的低频系数和部分高频均值系数作为特征向量表示原始序列;然后用多维索引结构R树存储这些特征向量,将欧几里德距离作为相似尺度,在此基础上实现了范围查询和k近邻查询,对电力负荷时间序列数据的仿真实验结果表明了算法的有效性。  相似文献   

4.
提出一种新的股市技术分析模型,该模型利用模糊逻辑理论及生物序列比对方法的思想,加以改进,应用于传统的K线图理论,将单位时间的开盘、收盘、最高、最低价格编码成模糊K线图,通过模糊序列比对,来对K线图进行模式识别.以上海和深圳自1990年开市以来到2006年的所有数据作为比对数据库,以2007年、2008年的数据作为测试对象,对上海和深圳股票市场中的部分股票中的K线图模式及未来趋势作了分析和预测,取得了可观的结果.统计结果表明,一些K线模式序列的未来趋势分布具有涨跌信号预警的功能;而另一些模式则为平凡的序列匹配,它们未来趋势的分布不具有预警的功能.  相似文献   

5.
时间序列相似模式的有效匹配   总被引:2,自引:0,他引:2  
将经验模式分解和多层前向网络的交叉覆盖算法相结合,提出一种时间序列相似模式的匹配算法.先利用经验模式分解实现时问序列趋势的提取,再把所有的趋势序列分成训练集和测试集2个部分.通过训练为每个类别做出描述,根据测试集中的每个趋势序列和覆盖中心之间的距离把它们分配到与之最匹配的类别中.实验结果表明:该算法是一种较理想的序列模式匹配方法,更擅长于维数较高的序列的匹配.  相似文献   

6.
时间序列数据挖掘是时态数据挖掘的一个重要方面,针对金融时间序列非稳定、非线性的特点,使用EMD方法进行序列趋势的提取,得到了原始时间序列的长期趋势。在此基础上提出了子序列分层匹配算法,首先进行时间序列趋势的粗匹配,在结果集中进一步进行细节匹配,与传统方法相比,提高了相似性匹配的效率,减少了结果集的冗余。  相似文献   

7.
维护已发现的序列模式的方法主要有两种:一种是简单地利用已有的挖掘序列模式算法对更新后的整个数据库进行操作,这种方法涉及的数据库中的数据不仅有改变的部分而且有未改变的部分,而未改变的数据数量很大,当更新频率高时,代价是非常大的;另一种方法是根据库中记录数目改变的多少来决定何时对整个数据库进行操作,但是记录数目数据并不能代表序列模式化亦大,因此利用样品抽样的方法来评估序列模式改变的程度,并根据改变的程度决定何时对整个数据库进行操作来更新序列模式,从而较好地解决序列模式维护的问题,能高效地、准确地发现序列模式。  相似文献   

8.
在序列拼接中,为了解决重复序列这个难题,本文提出了利用KMP匹配算法来识别并屏蔽重复序列的方法.该方法利用模式序列中的失效函数计算得到失效链接值,也就是当前一位置匹配失败后,下一次匹配开始的位置.利用这一函数避免了可预见的无用搜索,将穷举搜索算法所需的计算量大大减少.通过计算机模拟,验证了对重复序列的屏蔽,该算法将穷举算法所需时间复杂度由原来的减少到了.  相似文献   

9.
谢挺  楼巍 《微计算机信息》2006,22(27):254-256
贸易数据是按时间记录下的、不断更新中的海量数据。首先引入时间序列模式的概念,分析了时间序列的本质问题;其次改进了AprioriAll算法挖掘贸易序列数据库的有用序列模式;然后使用离散傅里叶变换子序列相似性查找的方法,将现有序列与挖掘到的感兴趣的序列模式进行子序列匹配,得到有用的知识;最后结合实际情况,合理搭建系统平台,将改进的算法应用在该平台之下得到满意的效果。  相似文献   

10.
基于SVM的混沌时间序列分析   总被引:1,自引:0,他引:1  
支持向量机是一种基于统计学习理论的新的机器学习方法,该方法已用于解决模式分类问题.本文将支持向量机(SVM)用于混沌时间序列分析,实验数据采用典型地Mackey-Glass混沌时间序列,先对混沌时间序列进行支持向量回归实验;然后采用局域法多步预报模型,利用支持向量机对混沌时间序列进行预测.仿真实验表明,利用支持向量机可以较准确地预测混沌时间序列的变化趋势.  相似文献   

11.
基于互关联后继树的时间序列相似性查询   总被引:4,自引:0,他引:4  
时间序列的相似性查询是分析时间序列变化规律的一种重要方法,对于时间序列的分类、预测以及知识发现都具有重要的现实意义。提出了一种基于分段技术的、同时支持可变长度的快速相似性查询方法。其主要思想是:首先依据序列变化的重要点将序列逐步分段,抽取各子段的变化特征,通过分类方法将其转变成符号序列,在此基础上,引入一种称为互关联后继树的全文索引技术,从而实现序列的快速相似性查询,其时间复杂度降到了O(L),此外,该算法还保证在建立索引后查询结果不会有任何的错误丢失。  相似文献   

12.
时间序列的相似性的分层查询   总被引:1,自引:0,他引:1  
提出了一种新的基于重要点的分段方法,将时间序列数据转换为趋势序列。在进行相似性比较时先进行趋势相似的比较,然后对结果进行欧氏距离的比较。实验结果表明该算法是有效的。  相似文献   

13.
研究了应用数据挖掘技术预测时间序列数据中事件的方法。针对时间序列数据提出了显著特征提取算法,给出了特征间的相似度量标准,并应用特征聚类算法,将时间序列数据转换成相应的特征序列表示。应用频繁模式发现算法和预测模式生成算法在预测时段内发现与目标事件相关的时序特征模式,预测事件的发生。实验结果表明,该文所提出的方法能够有效地预测时间序列数据中的事件。  相似文献   

14.
为解决符号聚合近似方法(SAX)表示时间序列时忽略序列局部趋势的问题,提出一种融合形态趋势信息的时间序列符号聚合近似方法。该方法以子序列段中的最大值和最小值以及它们两者之间的相对位置为依据,定义一种新的趋势指标来描述子序列段的趋势,并使用融合趋势指标的符号矢量来近似表示时间序列。针对所提表示方法,给出一种新的距离度量方法,并在UCR数据集和电机转矩数据集上进行分类实验,实验结果表明,所提方法在绝大多数数据集上获得了较SAX方法更高的分类准确率,能够有效弥补SAX方法表示时间序列时忽略局部趋势的不足。  相似文献   

15.
一种时间序列快速分段及符号化方法   总被引:1,自引:0,他引:1  
任江涛  何武  印鉴  张毅 《计算机科学》2005,32(9):166-169
作为一类重要的复杂类型数据,时间序列已成为数据挖掘领域的热点研究对象之一.针对时间序列的挖掘通常首先需要将时间序列分段并转变为种类有限的符号序列,以利于进一步进行时间序列模式挖掘.针对当前的时间序列分段方法复杂度较大,效率不高等问题,本文提出了一种简单高效的基于拐点检测的时间序列分段方法,并且采用动态时间弯曲度量计算不等长子序列的相异度,最后运用层次化聚类算法实现子序列的分类及符号化.实验表明,本文所提出的方法切实可行,实验结果具有较为明显的物理意义.  相似文献   

16.
多变量时间序列模式挖掘的研究   总被引:4,自引:0,他引:4  
张军  吴绍春  王炜 《计算机工程与设计》2006,27(18):3364-3366,3384
多变量时间序列数据集合在许多领域中存在,由于其观测变量之间的相互关联性,往往需要进行综合分析.使用基于时间序列相似性的多变量时间序列模式挖掘方法,从历史数据中寻找出相似的多变量时间序列.将多变量的数据集分段平均为连续矩阵,并采用基于主成分分析和奇异值分解的方法来对矩阵进行相似性比较,最后通过相邻片断的合并以组成更高层次的时序片断,以提高模式的匹配的范围.并在地震前兆数据进行了实现.  相似文献   

17.
滑动聚集平均近似PAA(Piecewise Aggregate Approximation)是一种表示时间序列的方法,它通过时间序列上滑动一个等宽的滑动窗口将时间序列分成小的区段。考虑到时间序列的时间特性q-不同区段的影响,本文提出了一种改进表示RPAA(Reversed Piecewise Aggregate Approximation)。RPAA表示对处于不同时间段的序列赋以不同的影响因子,具有线性时间复杂度,并且证明了RPAA满足下界定理,因而能够进行实际的查询。最后的实验表明该表示是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号