首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 73 毫秒
1.
针对现有处理不完全数据的填充方法,对数据集引入新的噪声这一问题,提出一种基于最大间隔理论的预测模型,直接使用含缺失特征的样本进行预测,通过实验验证该模型优于常用的填充模型。  相似文献   

2.
随着大数据与AI技术的发展,由数据驱动的预测模型层出不穷,数据清洗在提升这些模型预测中起着重要的作用。从公交车运行数据的时空相关性入手,分析了公交大数据存在的四类异常,接着在对时间相关性、空间邻近性、时空依赖性等公交大数据特性的分析基础上,提出了整合缓冲区、四分位数、时间依赖网络等时空处理方法的冗余清洗、范围清洗、异常清洗、补全清洗四种清洗方法,然后对公交进出站、轨迹数据集用这几种清洗方法进行了清洗。在不同清洗数据集下,通过LSTM公交到达时间预测精度的比较分析,证明了数据清洗对预测精度的提升是显著的。  相似文献   

3.
为提高数字电影流动放映中各院线放映场次的预测精度,基于院线放映场次的时空相关性,提出一种最邻近法和时空序列相结合的预测方法:通过最邻近法选取与待预测院线放映最相关的院线作为预测辅助院线;通过构造神经网络的时空序列将这些相关院线放映场次的时、空特征结合起来,产生更精确的预测模型。实验对比分析了此方法与传统时间序列预测方法的预测结果,证明了该方法具有更高的预测精度。  相似文献   

4.
孟伟 《计算机测量与控制》2014,22(11):3539-3542
在分布式系统中,系统的规模庞大,结构复杂,这使得故障数据的收集十分困难;为了对分布式系统进行故障诊断,文章提出了一种基于不完全故障数据的故障诊断方法;首先,应用非对称比较方法进行系统的故障诊断;其次,将系统的故障诊断转化为一个二分类问题;最后,根据系统运行的部分症状数据,应用线性支持向量机模型对系统中的节点状态进行分类;模拟实验表明,文章提出的方法能有效的识别出系统中的故障;此外为了进一步提高该方法的执行效率,可以采用系统的部分症状数据将故障节点限定在一定的范围内。  相似文献   

5.
针对当前流量预测模型未考虑时空相关性的问题,影响预测精度,提出一种基于梯度提升回归树的卫星网络流量预测方法.分析卫星网络流量的时空相关性,提取与目标卫星的时空相关流量作为原始的预测输入,并对得到的时空相关流量进行奇异矩阵分解,消除相关输入流量的信息重叠和冗余问题,最后通过改进的梯度提升回归树进行预测.仿真实验表明,该方...  相似文献   

6.
基于不完全数据的TAN学习算法   总被引:1,自引:0,他引:1       下载免费PDF全文
TAN算法是一种针对复杂数据且在实际中具有极强的学习能力的有效算法,它已被广泛应用于数据挖掘、机器学习和模式识别领域。由于现实世界中的数据大多是不完全数据,研究了怎样使TAN有效地从不完全数据中学习。首先,用一种有效的方法直接从不完全数据中估计条件互信息,然后应用估计条件互信息法去扩展基本的TAN算法来处理不相关数据,最后实验比较了扩展的TAN算法和基本的TAN算法。实验结果表明,在大多数不完全数据集合上扩展的TAN算法精确性明显高于基本的TAN算法。虽然扩展的TAN算法时间复杂度高于基本的TAN算法,但在可接受范围之内。此估计条件互信息的方法能够容易地和其它技术相结合来进一步提高TAN算法的性能。  相似文献   

7.
针对UMHexagonS算法体现出来的问题,利用时间预测向量和空间预测向量的位置映射关系,提出了一种新的运动估计算法--基于时空预测向量相关性的运动估计算法。该算法首先在小范围得到最优点后,继续利用预测矢量的时空方向相关性进行特定方向的扩展搜索,避免了提前落入局部最优点,并减少了搜索点数,从而提高了搜索质量。实验结果表明,与UMHexagonS算法相比,该算法在保持码率基本不变的情况下,能有效地减少运动估计时间,并且能一定程度地提高单帧的峰值信噪比。关键词:  相似文献   

8.
传统的光伏发电功率预测方法爬坡预测可靠性较低,准确性不高.于是提出一种时空相关性的光伏发电功率爬坡预测方法.在典型日理想光伏发电出力归一化曲线提取基础上,采用线性插值方法生成光伏发电理想出力归一化曲线.通过蒙特卡洛法生成光伏发电随机分量,结合光伏发电与随机分量生成光伏发电序列;通过偏移爬坡率及变量状态划分方法构建信度网络节点变量和各节点变量的状态集;利用贪婪搜索算法从已有变量的状态集中获取最优信度网络结构后,进行光伏发电序列学习,完成光伏发电功率爬坡事件预测.实验结果表明,上述方法可有效完成光伏发电序列生成,并且爬坡预测可靠性较高,可实现多种气象条件下的光伏发电功率爬坡预测.  相似文献   

9.
函数依赖(FD)挖掘方法通常专注于发现所有满足函数依赖语法特征的结果,在数据不完整的情况下常导致大量成立但无意义的FD。针对挖掘无效FD的问题,提出基于相关性分析的不完整数据FD挖掘方法。利用概率图模型构建具有缺失值属性的概率分布,通过相关性分析捕捉属性之间的关联关系,避免枚举所有可能性,以挖掘具有统计学意义的FD。实验结果表明,提出方法可以更准确的定位到有意义的FD,与最先进的FD发现方法相比F1分数平均提高1.5倍。  相似文献   

10.
时空序列预测方法综述   总被引:1,自引:0,他引:1  
随着数据采集技术的进步,带有地理位置信息的时空数据迅速增长,迫切需要探索有效的时空数据建模方法。时空序列预测是时空数据建模的基础方法之一,它广泛应用于很多领域。目前缺乏对它进行综述的中文文献,因而对这些方法进行归纳和总结具有重要的研究意义。针对时空序列预测问题进行了研究,首先回顾了其应用背景和发展历程,介绍了它的相关定义及特点。然后按其类别介绍了传统的时空序列预测方法、基于传统机器学习的时空序列预测方法和基于深度学习的时空序列预测方法,并分析了这些方法的应用范围和优缺点。最后对时空序列预测未来的研究方向进行了梳理和展望,为研究者们进一步深入研究时空序列预测问题奠定了理论基础。  相似文献   

11.
针对数据连续缺失情况下交通流预测精度下降甚至失效的问题,提出了一种时空卷积神经网络预测模型,根据横向分布的时间相关性和纵向分布的空间相关性,构建路网交通数据时空矩阵,引入掩码矩阵标记数据的缺失状况,利用卷积操作提取路网中各检测器之间隐含的非线性关联,建立当前时刻与未来交通状态的映射关系,实现数据缺失情况下的交通流预测....  相似文献   

12.
基于浮动车数据的快速交通拥堵监控   总被引:1,自引:0,他引:1  
浮动车技术是近年来智能交通系统中所采用的、获取道路交通信息的先进技术手段之一,可作为大规模实时交通监控的数据源.由于浮动车数据规模庞大,从大量移动对象中有效处理流数据是其中一大难点.采用相似轨迹聚类的思想,结合与拥堵特征相关的交通参数,提出了拥堵同伴发现算法.该算法能从浮动车轨迹流数据中筛选出可能发生拥堵的浮动车数据,从而对拥堵区域变化趋势进行概化预测,由预测结果决定负载处理方式.此外,设计基于预测的多优先级调度算法用以实现整个监控流程.提出的方法可有效降低处理浮动车数据的代价,实现快速交通拥堵监控.通过在城市路网中大规模出租车轨迹数据上的实测,验证了这种算法的有效性和优势.  相似文献   

13.
交通流精准预测对保障公共安全和解决交通拥堵具有重要的意义,在城市交通规划、交通管理、交通控制等起着重要的作用.交通预测由于其受限制于城市路网并且随着时间动态变化,其中存在着空间依赖与时间依赖,是近些年来具有挑战性的课题之一.为了同时捕获到空间和时间上的依赖,提出了一个新的神经网络:基于注意力机制的时空图卷积网络(A-TGCN).TGCN网络模型用于捕获交通数据中的动态时空特性与相关性,采用注意力机制来增强每个A-TGCN层中关键节点的信息.通过在两组数据上的实验结果表明,A-TGCN在精度以及可解释性方面都有很好的表现.  相似文献   

14.
加油站是重要的能源供给单位,对加油站站点的下一时段客流量进行精准预测,可为相关资源的调度与分配提供决策支撑.针对加油站级客流量预测问题,结合加油站客流数据的时空特征,提出一种基于注意力机制的时空网络模型.以路网结构建模的站级客流数据为输入,结合卷积神经网络、长短期记忆网络与注意力机制,解决站点间的空间依赖、短期与长期时...  相似文献   

15.
交通问题不仅影响人们的出行,同时也会带来环境污染以及安全等问题,准确的交通流预测是构建智能交通系统、预防和缓解交通问题的关键.目前的预测方法大多没有考虑到交通流动态的时空相关性、周期性以及线性与非线性等特点.在充分考虑上述因素的基础上,提出一种基于信息增强传输的时空图神经网络模型,主要包含多特征注意力模块、信息增强传输模块、时间注意力模块以及线性与非线性融合模块.其中,多特征注意力模块捕获多种交通特征之间的内在联系,考虑交通流的周期性;信息增强传输模块充分利用了交通网络信息,以增强交通网络的信息传输能力,进而挖掘出复杂动态的空间依赖关系;时间注意力模块负责自适应地提取不同时间间隔之间的依赖关系;线性与非线性融合模块则同时考虑了数据的线性与非线性特征.论文在真实数据集上进行了大量对比实验,实验结果表明,对比目前较为先进的基线方法,提出的方法在交通流的预测性能方面,体现了较为明显的优势.  相似文献   

16.
基于混合预测模型的VBR流拥塞控制机制   总被引:1,自引:0,他引:1       下载免费PDF全文
李捷  吕冰  韩志杰 《计算机工程》2008,34(24):34-37
针对VBR多媒体流量的数字特征,在混合网络流量预测模型的基础上,结合小波分析和卡尔曼滤波,提出一种多媒体流自适应带宽分配算法,以合理分配网络带宽,利用双重漏桶控制网络流量。在NS网络仿真平台上进行的仿真实验表明,该算法能有效避免网络拥塞,降低网络传输时延和数据丢包率,提高带宽利用率。  相似文献   

17.
为了能够长期对监测区域进行持续的数据采集,无线传感网通常运行在休眠调度模式,这种模式使得网络的通信连通性处在动态变化之中,造成一种新的网络拥塞现象——数据源拥塞.这种拥塞问题会造成节点缓存区溢出,从而导致数据丢失,甚至造成节点不响应任何数据转发请求,该问题在传感器异构的无线传感网中表现得更为严重.许多典型的拥塞控制方法是令网络中的数据绕过拥塞节点进行传输,也有一些方法是对拥塞节点的通信速率进行控制,但是以上这些方法无法缓解数据源拥塞的影响.分析影响数据源拥塞的因素,建立了描述节点数据源拥塞概率的传送带模型,提出了一种以降低数据源拥塞概率为目的的节点休眠调度机制(district cooperation schedule, DCS).通过理论推导和实验分析,证明该模型可以较准确地预测数据源拥塞概率,同时DCS可以有效降低数据源拥塞现象的发生.  相似文献   

18.
城市交通流预测是研究交通时空序列数据的动态演化并预测未来交通情况的关键技术,对于智能交通预警及管理决策来讲至关重要.但是有效的交通流建模非常具有挑战性,因为它受到很多复杂因素的影响,例如交通网络的时空依赖性和序列突变性等问题.一些研究工作将卷积神经网络(convolutional neural networks, CNN)或循环神经网络(recurrent neural networks, RNN)用于交通流量预测建模.但是,直接使用经典的深度学习模型难以有效捕获与交通流相关的多通道多变量序列数据中的隐含时空依赖性特征.针对上述问题,提出了一种新的序列到序列时空注意力深度学习框架(spatial-temporal attention traffic forecasting, STATF)来处理城市交通流建模任务,它是一种基于卷积LSTM编码层和LSTM解码层,并辅助注意力机制的端到端深度学习模型,可以自适应地学习与城市交通流相关的多通道多变量时空序列数据中的时空依赖性和非线性相关性特征.基于3个真实的交通流数据集实验结果表明:不管是单步预测还是多步预测条件下,STATF模型都具有更优的预测性能.  相似文献   

19.
张安珍  李建中  高宏 《软件学报》2020,31(2):406-420
研究了基于符号语义的不完整数据聚集查询处理问题.不完整数据又称为缺失数据,缺失值包括可填充的和不可填充的两种类型.现有的缺失值填充算法不能保证填充后查询结果的准确度,为此,给出了不完整数据聚集查询结果的区间估计.在符号语义中扩展了传统关系数据库模型,提出了一种通用不完整数据库模型.该模型可以处理可填充的和不可填充的两种类型缺失值.在该模型下,提出一种新的不完整数据聚集查询结果语义:可靠结果.可靠结果是真实查询结果的区间估计,可以保证真实查询结果有很大概率在该估计区间范围内.给出了线性时间求解SUM、COUNT和AVG查询可靠结果的方法.真实数据集和合成数据集上的扩展实验验证了所提方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号