共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
随着传感器网络、大规模实时监控等相关技术的发展和应用,出现了大量的流式数据,如何对这些数据进行查询分析是目前研究的热点.Top-k查询作为一种基础聚集查询,在很多领域起着重要作用.主要研究对于具有不同时间窗口的多个Top-k查询,如何提高资源共享的性能.提出了一种资源共享策略RS-Tpk,充分利用了Top-k查询本身的特点,通过在不同切片间进行数据传递,提高切片间资源共享的范围,降低了计算时间.详细的实验和理论分析证明了该方法的有效性. 相似文献
3.
基于相反分类器的数据流分类方法 总被引:2,自引:0,他引:2
目前挖掘概念流动的数据流已经成为研究的热点。概念流动的数据流分类在预防信用卡欺诈,网络入侵发现等应用中具有重要的应用。本文定义了一种相反分类器来从错误中学习,提出了训练一个集合分类器来对具有概念流动的数据流进行分类的算法IWB。通过在合成数据集和benchmark上的实验,与Weighted Baggging算法比较,表明我们的算法具有更高的准确度,更快地收敛到新的目标概念的性能。 相似文献
4.
高速数据流实时存储的实现方案 总被引:1,自引:0,他引:1
针对高速数据采集应用中的大容量、高速、实时存储问题,提供了一种使用凌华公司的PCI-7300A和PCI-DASK、Adaptec公司的SCSI控制器29160和ASPI等产品的解决方案.该解决方法具有简便易行、可靠、成本低等优点. 相似文献
5.
6.
7.
8.
提出了一种新的CMNL-SW(Closed map and num list-sliding window)挖掘算法。具体使用数据结构Closedmap存储挖掘到的闭合项集和Num list存储所有不同项的序号,通过对添加新事务和删除旧事务包含的项序号进行简单的并集和该事务与之相关已经挖掘到的闭合项集进行交集运算来更新当前滑动窗口,使之能够根据用户任意指定的支持度阈值在线输出数据流上闭合频繁项集信息。通过理论分析和对真实数据集Mushroom,Retail-chain和人工合成数据集T40I10D100K的挖掘结果表明,提出的算法在时空效率上明显优于同类经典算法Moment和CFI-Stream,并且随着数据流上处理事务数的递增和快速改变表现出良好的稳定性。 相似文献
9.
近年来计算机软硬件性能飞速发展,数据流被广泛应用于传感器阵列、互联网信息的传输、数据决策支持系统(DSS)等诸多领域。数据流的传输速度越来越快,传输规模越来越大,人们对数据处理的时间要求越来越高。利用Lipschitz指数和切比雪夫定理,提出了一种数据流异常检测的算法,与传统方法相比具有同时包含整体和局部数据信息、计算量稳定的特点。 相似文献
10.
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型, 关键在于从实时到达且不断变化的数据流中检测并适应概念漂移. 目前, 为检测概念漂移和更新分类模型, 数据流分类方法通常假设所有样本的标签都是已知的, 这一假设在真实场景下是不现实的. 此外, 真实数据流可能表现出较高且不断变化的类不平衡比率, 会进一步增加数据流分类任务的复杂性. 为此, 提出一种非平衡概念漂移数据流主动学习方法(Active learning method for imbalanced concept drift data stream, ALM-ICDDS). 定义基于多预测概率的样本预测确定性度量, 提出边缘阈值矩阵的自适应调整方法, 使得标签查询策略适用于类别数较多的非平衡数据流; 提出基于记忆强度的样本替换策略, 将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中, 提升新基分类器的分类性能; 定义基于分类精度的基分类器重要性评价及更新方法, 实现漂移后的集成分类器更新. 在7个合成数据流和3个真实数据流上的对比实验表明, 提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 相似文献
11.
一种基于HLA的通用仿真数据收集方法 总被引:6,自引:0,他引:6
随着HLA技术在国内的发展,开发基于RTI平台的通用仿真工具已经成为潮流。在开发过程中所要解决的一个关键问题就是如何达到通用。传统上有利用MOM类和动态编译两种方法,但都有其局限性。该文提出了一种新的通用仿真数据收集方法(General Simulation Data Collect,GDSC)方法。该方法的实现由配置模块、动态订购模块和解包模块三个模块构成。通过配置模块获得订购信息,动态订购模块进行订购,解包模块解析出具体数据内容,成功地解决了“与具体仿真应用的无关性”和“仿真过程中与具体仿真过程相关性”之间的矛盾,实现了“通用”。 相似文献
12.
一种适应性的流式数据聚集计算方法 总被引:2,自引:2,他引:0
针对流式数据聚集查询问题,提出了一种基于适应性层次聚集树的计算方法。适应性层次聚集树结构基于多层次时间窗口模型,将距离当前时刻较近的数据保存为细粒度数据,而相对久远的数据仅保留高层聚集信息;适应性层次聚集树中粒度的划分取决于相应时间间隔的数据密度。稀疏密度的时间间隔对应粗粒度的划分,而高密度的间隔对应细粒度的划分。并且提出了相应的构建维护以及聚集查询计算方法。实验结果表明,该方法在非均匀分布条件下的流式数据聚集计算中具有较为明显的优势。 相似文献
13.
14.
掌握、分析、控制局域网中的数据流向与流量是目前网络管理员都要做好的一件事,根据TCP/IP体系结构中各协议的基本工作原理进行网络管理是目前网管人员的基本思路,利用目前网络传输设备的性质进行网络管理是实现网管的基本方法.本文就目前局域网中使用最多的网络设备Hub和Switch,分别进行这个方面的探讨. 相似文献
15.
流数据的查询应用十分广泛,而标准SQL语言不支持这类查询功能,因此有必要对标准SQL语言进行扩展,以满足流数据的查询应用需求。支持流数据的查询语言StreamSQL在标准SQL语言的基础上增加了对流数据对象的处理机制,通过引入滑动窗口的概念,以支持流数据与关系表的相互转换操作,同时提供用户自定义函数功能,弥补了SQL在流数据处理方面的不足。 相似文献
16.
本文对化学实验中常出现的,具有线性模型的正整参数估计问题,提供了一种统计分析方法,并给出了一个完整算法,由计算机程序实现。这种算法对实验教学也十分有用,可以及时、准确地对学生的实验数据作出定量的评价。 相似文献
17.
《计算机科学与探索》2016,(11):1512-1523
在车联网的应用实践中,人们将分析车辆数据的任务运行在流式计算系统中。在运行分析中发现,这些任务具有运行周期长,处理延迟低,任务有状态等需求和特点,并且计算过程中需要在内存中保存大量计算参数和中间状态等数据对象,其中大量的数据对象并不活跃,任由其占用内存造成了系统资源的浪费。针对该问题开展研究,给出了流式任务的数据对象管理方法,优化了内存的使用。为流式数据对象建立生命周期模型,采用应用驱动、数据驱动的模型参数确定方法为流式数据对象设置合适的过期参数,设计车联网测试用例,验证该生命周期管理方法的有效性。实验结果表明,该方法在用户可接受的处理延迟范围内,能够有效地减少流式系统中不活跃对象的数目,达到了优化内存,降低资源开销的目的。 相似文献
18.
19.