首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
杨艳林  叶枫  吕鑫  余霖  刘璇 《计算机科学》2016,43(2):245-249
水文时间序列相似性挖掘是水文时间序列挖掘的重要方面,对洪水预报、防洪调度等具有重要意义。针对水文数据的特点,提出了一种基于DTW聚类的水文时间序列相似性挖掘方法。该方法先对数据进行小波去噪、特征点分段以及语义划分,再基于DTW距离对划分后的子序列做层次聚类并符号化;然后根据符号序列间的编辑距离筛选候选集;最后通过序列间的DTW距离进行精确匹配,获取相似水文时间序列。以滁河六合站的日水位数据进行实验,结果表明,所提方法能够有效地缩小候选集,提高查找语义相似的水文时间序列的效率。  相似文献   

2.
到目前为止能够计算字符化时间序列的距离度量的方法很少,为此,提出了一种新的字符化的时间序列表示方法BSAP。该方法既能进行维度约简又允许在符号化后的时间序列表示法上定义距离度量。实验分别在合成数据和实际数据上进行,实验表明该方法具有更高的运算效率且需要较少的空间。  相似文献   

3.
基于互相关的二阶段时间序列聚类方法   总被引:1,自引:0,他引:1  
提出了一种高效的时间序列聚类方法,以互相关函数为基础,通过二阶段的方法实现更低时间复杂度下的时间序列聚类。第一步以时间序列符号化为基础,通过设计符号化序列特征抽取算法,抽取特征时间段;第二步以互相关函数为基础,通过改进的互相关函数步骤,实现更快速的时间序列聚类。实验结果表明,该方法可以适应稀疏及密集的时间序列数据抽取,同时与传统的聚类距离公式相比,处理速度更快,对时间序列形状的缩放有更好的表示效果,并能保持较高准确性。  相似文献   

4.
基于特征点转换的时间序列符号化方法   总被引:1,自引:0,他引:1       下载免费PDF全文
将时序数据有效地映射到特征空间是时间序列相似性搜索的一个关键问题。文章结合时间序列符号化思想与分段线性表示中分段点选取的思想,提出一种基于特征点转换的时间序列符号化方法FPTS。该方法能有效提取序列的形状特征,在降维和除噪的同时保留序列的极值点特性,支持基于动态时间弯曲距离的相似性度量,克服传统的符号化方法受限于精确匹配的缺陷。实验证明了该方法的准确性和高效性。  相似文献   

5.
符号化表示是一种有效的时间序列降维技术,其相似性度量是诸多挖掘任务的基础。基于SAX(sym-bolic aggregate approximation)的距离MINDIST_PAA_iSAX不满足对称性,在时间序列挖掘中具有局限性,提出了对称的度量Sym_PAA_SAX,且下界于欧拉距离。在真实数据集和合成数据集上的实验说明下界紧密性较好,相似搜索错报率较低。  相似文献   

6.
符号化表示技术,可以有效降低时间序列的维度,是实现海量时间序列数据挖掘的基础.聚类结果的精度是运用聚类方法对多元时间序列进行符号化表示的关键.运用共同马氏距离虽然可以实现多元时间序列的符号化表示,但忽略了不同类样本数量对聚类结果的影响,从而降低了符号化表示的有效性.针对上述问题,提出一种改进共同马氏距离的多元时间序列符号化表示方法,通过改进共同协方差矩阵的计算方法,优化了聚类结果,从而提高了符号化表示的有效性.仿真结果表明,改进后的方法可以更加有效地对多元时间序列进行符号化表示.  相似文献   

7.
基于符号化表示的时间序列频繁子序列挖掘   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种新的基于符号化表示的时间序列频繁子序列的挖掘算法。利用基于PAA的分段线性表示法进行降维,通过在高斯分布下设置断点,实现时间序列符号化表示,利用投影数据库挖掘频繁子序列。该算法简单、新颖,运行快速,简化了子序列支持数的计算。  相似文献   

8.
提出了一种简单高效的多维离散时间序列符号化方法,该方法用模糊自适应共振理论(Fuzzy ART)对多维时间序列数据进行聚类,实现多维时间序列数据的符号化问题。同时,通过属性相关性预处理分析,过滤掉聚类中不相关或弱相关的属性,保证了聚类算法的准确性,将提出的算法应用于多维交通流数据的符号化,效果很好。  相似文献   

9.
符号化聚集近似是一种有效的时间序列数据离散化降维方法,为了扩展非等维符号化时间序列相似性度量的解决方案,提出了一种新方法。首先将关键点提取技术应用在符号化算法中对时间序列进行降维处理,然后利用文中提出的方法对非等长的时间序列进行局部等维处理,再符号化;最后采用不同的方法进行相似度对比计算。实验结果表明,这种方法是简单而有效的,并且使非等长符号化时间序列的相似性度量及聚类方法得到了拓展。  相似文献   

10.
针对时间序列关联规则挖掘存在时间复杂度高、效率低等问题,将基于SFVS(统计特征矢量符号化)的时间序列表示方法引入到时序关联规则发现中,利用描述时序数据统计特征的均值与方差分别作为描述其平均值及发散程度的分量,实现时间序列表示的矢量化,然后再进行动态关联规则挖掘。实验结果表明,基于该方法所获取的关联规则具有更高的精确度和可信度。  相似文献   

11.
模糊聚类挖掘方法在电子商务中的应用研究   总被引:1,自引:0,他引:1  
系统聚类法中常用的是最小距离法、最大距离法、重心距离法、类平均距离法等,这些方法都是定义一种类与类之间的距离来进行聚类的,但在有些情况下其聚类结果不唯一,文章利用模糊关系短阵,给出了一种新的基于模糊聚类的方法,并将这些技术应用到具体电子商务平台的数据挖掘工作中,得到了可行性验证,从而为此技术在电子商务领域的广泛应用起到了较好的示范作用。  相似文献   

12.
障碍物测距是高压输电线路自主除冰机器人的关键技术之一。针对220 kV输电线路除冰机器人的结构特点,提出了一种基于扩展卡尔曼滤波的障碍物距离信息融合检测方法。首先根据障碍物分布情况设计了除冰机器人多传感器检测系统的结构,建立了障碍物信息融合系统模型。然后根据障碍物信息状态模型的非线性特点,对传感器获取的异步测量数据进行同步处理,再应用改进的扩展卡尔曼滤波对多传感器信息进行滤波和融合,并与单个传感器的结果相比较,实验结果研究表明:该方法能有效地融合不同传感器的信息,具有更高的测距精度和更快的收敛速度。  相似文献   

13.
传统的基于真实距离的聚类分析方法不利于地震不同断层破裂传播和愈合速度的精确计算。为提高地震预测精度,提出并建立了基于软距离计算的聚类方法。给出了基于软距离聚类过程、软距离计算方法以及具体的基于软距离计算的聚类算法。以现实的强震样本点作为聚类数据源,采用该聚类方法以及其它传统聚类方法对该样本数据进行聚类分析。分析结果表明,采用该聚类方法获得的聚类中心点更接近地壳应力场演变的客观真实性,该聚类分析方法为地震的断层带下次发生强震的精确计算提供了很好的计算依据。  相似文献   

14.
低秩表示(Low-Rank Representation,LRR)在探索数据中的低维子空间结构方面具有良好的效果,近年来引起了人们的广泛关注。然而,传统的LRR方法通常使用欧氏距离来度量样本的相似性,仅考虑相邻样本两两之间的距离信息,对于具有流形结构的数据往往不能反映其固有的几何结构。最近的研究表明,概率激励距离测量(即有效距离)可以有效地对数据的全局信息进行建模,来度量样本间的相似性。在此基础上,提出了一种基于有效距离的低秩表示模型。该方法用稀疏表示方法计算样本之间的有效距离来构造拉普拉斯矩阵,并将其进行低秩表示拉普拉斯正则化约束,该模型不仅能表示全局低维结构,而且能捕获流形结构数据中的几何结构信息。为了评估方法的有效性,在三个公开数据集上进行了分类实验。实验结果表明,该方法比基于传统欧氏距离的方法,具有更高的分类性能和更强的鲁棒性。  相似文献   

15.
针对已有分裂算法时间复杂度较高,不适用于社团数目未知的大型网络等问题,借鉴电压谱分割算法和GN算法的思想,提出以扩散距离为分割依据,以模块度函数为社团结构划分满意度的快速分裂算法.实验结果表明,与已有的社团结构划分算法相比,基于扩散距离的快速分裂算法能够得到高质量的社团结构,其时间复杂度较低,不仅对稀疏网络能够快速运算...  相似文献   

16.
现代生产中的大量生产数据蕴藏着丰富的生产过程和质量信息,通过聚类分析可以了解生产状态,进行生产故障诊断或有针对性的质量检测,而经常使用的相似性的度量欧式距离只能反映数据空间分布为球形或超球形的结构特性。难以刻画复杂数据分布特性,将流形距离引入到生产过程状态的聚类分析中,利用标准数据、田纳西—伊斯曼过程和热轧带钢实际生产过程数据对方法的有效性进行验证,进而可以更加有效地了解生产过程的状态。  相似文献   

17.
在分析RS232和RS485串行通信接口工作原理和特点的基础上,确定了矿用馈电开关远程数据通信采用RS485标准接口的串行通信方案,实现了馈电开关和上位PC机的双向通信功能。实验表明该串行通信方法通信距离长,传输数据准确可靠,具有一定的实用价值。  相似文献   

18.
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种。针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM)。由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后, 结合 始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性。理论分析表明,该距离度量满足下界定理。在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAX_SM具有比SAX更优的分类效果。  相似文献   

19.
在靶场试验过程中,传统的单基准站由于基线长度的限制使其作用范围有限,从而超出一定距离后,差分精度随着大气误差相关性的减弱而明显受到影响;为了解决靶场GPS单频伪距差分定位距离远时精度下降问题,提出了多基准站GPS定位伪距差分定位方法;该方法深入分析伪距方程和伪距差分定位之间的关系;建立靶场基准站网络实时接收目标定位数据和基准站定位数据并实时传送到控制中心;利用基于距离的线性内差模型,设计多基准站数据处理算法和多基线测量数据加权处理方法,实时解算目标定位信息;测试结果表明,多基准站GPS定位伪距差分定位方法,能够有效地解决常规单基准站伪距差分定位精度随用户站与基准站距离增加而降低的问题,同时提高了测试精度。  相似文献   

20.
传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号