共查询到20条相似文献,搜索用时 93 毫秒
1.
水文时间序列相似性挖掘是水文时间序列挖掘的重要方面,对洪水预报、防洪调度等具有重要意义。针对水文数据的特点,提出了一种基于DTW聚类的水文时间序列相似性挖掘方法。该方法先对数据进行小波去噪、特征点分段以及语义划分,再基于DTW距离对划分后的子序列做层次聚类并符号化;然后根据符号序列间的编辑距离筛选候选集;最后通过序列间的DTW距离进行精确匹配,获取相似水文时间序列。以滁河六合站的日水位数据进行实验,结果表明,所提方法能够有效地缩小候选集,提高查找语义相似的水文时间序列的效率。 相似文献
2.
到目前为止能够计算字符化时间序列的距离度量的方法很少,为此,提出了一种新的字符化的时间序列表示方法BSAP。该方法既能进行维度约简又允许在符号化后的时间序列表示法上定义距离度量。实验分别在合成数据和实际数据上进行,实验表明该方法具有更高的运算效率且需要较少的空间。 相似文献
3.
基于互相关的二阶段时间序列聚类方法 总被引:1,自引:0,他引:1
提出了一种高效的时间序列聚类方法,以互相关函数为基础,通过二阶段的方法实现更低时间复杂度下的时间序列聚类。第一步以时间序列符号化为基础,通过设计符号化序列特征抽取算法,抽取特征时间段;第二步以互相关函数为基础,通过改进的互相关函数步骤,实现更快速的时间序列聚类。实验结果表明,该方法可以适应稀疏及密集的时间序列数据抽取,同时与传统的聚类距离公式相比,处理速度更快,对时间序列形状的缩放有更好的表示效果,并能保持较高准确性。 相似文献
4.
5.
6.
符号化表示技术,可以有效降低时间序列的维度,是实现海量时间序列数据挖掘的基础.聚类结果的精度是运用聚类方法对多元时间序列进行符号化表示的关键.运用共同马氏距离虽然可以实现多元时间序列的符号化表示,但忽略了不同类样本数量对聚类结果的影响,从而降低了符号化表示的有效性.针对上述问题,提出一种改进共同马氏距离的多元时间序列符号化表示方法,通过改进共同协方差矩阵的计算方法,优化了聚类结果,从而提高了符号化表示的有效性.仿真结果表明,改进后的方法可以更加有效地对多元时间序列进行符号化表示. 相似文献
7.
8.
9.
符号化聚集近似是一种有效的时间序列数据离散化降维方法,为了扩展非等维符号化时间序列相似性度量的解决方案,提出了一种新方法。首先将关键点提取技术应用在符号化算法中对时间序列进行降维处理,然后利用文中提出的方法对非等长的时间序列进行局部等维处理,再符号化;最后采用不同的方法进行相似度对比计算。实验结果表明,这种方法是简单而有效的,并且使非等长符号化时间序列的相似性度量及聚类方法得到了拓展。 相似文献
10.
11.
12.
障碍物测距是高压输电线路自主除冰机器人的关键技术之一。针对220 kV输电线路除冰机器人的结构特点,提出了一种基于扩展卡尔曼滤波的障碍物距离信息融合检测方法。首先根据障碍物分布情况设计了除冰机器人多传感器检测系统的结构,建立了障碍物信息融合系统模型。然后根据障碍物信息状态模型的非线性特点,对传感器获取的异步测量数据进行同步处理,再应用改进的扩展卡尔曼滤波对多传感器信息进行滤波和融合,并与单个传感器的结果相比较,实验结果研究表明:该方法能有效地融合不同传感器的信息,具有更高的测距精度和更快的收敛速度。 相似文献
13.
14.
低秩表示(Low-Rank Representation,LRR)在探索数据中的低维子空间结构方面具有良好的效果,近年来引起了人们的广泛关注。然而,传统的LRR方法通常使用欧氏距离来度量样本的相似性,仅考虑相邻样本两两之间的距离信息,对于具有流形结构的数据往往不能反映其固有的几何结构。最近的研究表明,概率激励距离测量(即有效距离)可以有效地对数据的全局信息进行建模,来度量样本间的相似性。在此基础上,提出了一种基于有效距离的低秩表示模型。该方法用稀疏表示方法计算样本之间的有效距离来构造拉普拉斯矩阵,并将其进行低秩表示拉普拉斯正则化约束,该模型不仅能表示全局低维结构,而且能捕获流形结构数据中的几何结构信息。为了评估方法的有效性,在三个公开数据集上进行了分类实验。实验结果表明,该方法比基于传统欧氏距离的方法,具有更高的分类性能和更强的鲁棒性。 相似文献
15.
16.
17.
18.
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种。针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM)。由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后, 结合 始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性。理论分析表明,该距离度量满足下界定理。在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAX_SM具有比SAX更优的分类效果。 相似文献
19.
在靶场试验过程中,传统的单基准站由于基线长度的限制使其作用范围有限,从而超出一定距离后,差分精度随着大气误差相关性的减弱而明显受到影响;为了解决靶场GPS单频伪距差分定位距离远时精度下降问题,提出了多基准站GPS定位伪距差分定位方法;该方法深入分析伪距方程和伪距差分定位之间的关系;建立靶场基准站网络实时接收目标定位数据和基准站定位数据并实时传送到控制中心;利用基于距离的线性内差模型,设计多基准站数据处理算法和多基线测量数据加权处理方法,实时解算目标定位信息;测试结果表明,多基准站GPS定位伪距差分定位方法,能够有效地解决常规单基准站伪距差分定位精度随用户站与基准站距离增加而降低的问题,同时提高了测试精度。 相似文献