期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

数据世系管理技术研究综述 总被引：15，自引：1，他引：15

高明金澈清王晓玲田秀霞周傲英《计算机学报》2010,33(3)

世系描述了数据产生、并随时间推移而演变的整个过程,它的应用领域很广,包括数据质量评价、数据核查、数据恢复和数据引用等.数据世系大致可分为不同数据源之间的数据演化过程和同一数据源内部的数据演化过程,即模式级和实例级数据演化过程.文中以模式级和实例级数据世系的表示、查询为主线综述数据世系的研究进展.模式级世系部分主要介绍了查询重写和模式映射的世系追踪技术,实例级世系部分则从关系型数据、XML数据、流数据三方面总结了新近的研究进展.文中还综述了跟踪不确定性数据及其演化过程的研究进展.最后,列举了数据世系管理的应用,并讨论了世系分析研究面临的挑战及未来的研究方向. 相似文献

2.

RFID不确定数据管理技术 总被引：5，自引：1，他引：4

许嘉于戈谷峪王艳秋《计算机科学与探索》2009,3(6):561-576

有关不确定数据管理的研究是当前国际数据库研究领域的一个热点。不确定性作为RFID系统的一个重要特征,贯穿于RFID应用的整个生命周期。RFID系统主要存在两类不确定性:一类是客观不确定性,即原始数据客观存在不完整和不准确,这是造成RFID系统数据不确定的最直接原因;另一类是主观不确定性,这是由于对漏读数据的填补、对位置信息的推测、对事件语义的抽取和对事件发生时间的估计而产生的不确定性。详细归纳了RFID系统中数据不确定性的来源,介绍了RFID不确定数据管理技术的研究现状,并指出了目前面临的挑战。相似文献

3.

海洋台站不确定性数据表示方法的研究 总被引：1，自引：0，他引：1

郭利锐黄冬梅张弛《计算机应用与软件》2012,29(7):168-171,242

针对当前海洋台站数据存在不确定性的现状,在分析Trio和MayBMS两种不确定数据表示方法的基础上,结合海洋台站数据属性不确定的特点,提出一种适合于海洋台站不确定性数据的表示方法。实验结果表明,该方法能够消除现有表示方法可能产生的冗余信息并有效减少生成的关系表的数量,为今后海洋台站不确定性数据高效查询方法的研究奠定了基础。相似文献

4.

非确定性数据处理技术发展现状与挑战

丘晓平黄小兵《电脑与微电子技术》2012,(18):9-14

介绍非确定性数据处理的几种主流技术,即数据流、移动数据、传感器网络和数据世系的管理技术,描述这些技术的内涵、发展现状和挑战．指出该技术在我国未来建设智慧城市作为基础性支撑技术的重要性。相似文献

5.

不确定性数据频繁项集挖掘算法

下载免费PDF全文

张常品刘广钟《计算机系统应用》2014,23(11):160-164

由于不确定性数据大量存在于传感器网络,移动计算,军事,电信等应用领域,传统的频繁项集挖掘算法难以适用到不确定性数据挖掘。为了解决这个问题,本文提出了一种快速有效的算法,该算法基于可能世界模型,只需要扫描一次数据库,且没有建树的过程,通过实验证明,我们提出的算法比UF_Growth算法效率更高。相似文献

6.

面向大型数据集合的关键分类查找算法

许晓峰金澈清高明周傲英《计算机研究与发展》2009,46(Z2)

Top-k查询是Web和多媒体搜索、决策支持、分布式系统等众多领域中最重要的查询之一,它返回数据集合中k个最关键的元组.大型数据集合往往包含一系列分类型属性,获取对目标属性影响最大的k个分类型属性值对于许多应用中也非常重要.研究了这个问题,正式定义了k-AKC和PKC两种查询,并设计相应的查询处理算法.实验结果表明,改良算法PKCQ+具有较佳的有效性和高效性. 相似文献

7.

基于信息熵的不确定性数据清理方法 总被引：1，自引：0，他引：1

覃远翔段亮岳昆《计算机应用》2013,33(9):2490-2492

针对不确定性数据中往往包含一些异常数据而导致相应的查询结果出现错误的问题,提出了一种基于信息熵的不确定性数据清理方法以减少异常数据并提高不确定性数据的质量。首先使用信息熵来度量数据的不确定度,然后结合统计学方法计算出不确定性数据的可信区间,最后去除那些不在可信区间内的数据。实验结果验证了该方法的高效性和有效性。相似文献

8.

不确定Skyline查询技术研究 总被引：3，自引：0，他引：3

王意洁李小勇杨永滔祁亚斐王广东《计算机研究与发展》2012,49(10):2045-2053

当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务、移动对象管理网上购物和市场监控等各种实际应用中.不确定Skyline查询作为不确定数据管理的一个重要方面,由于其在决策制定、市场分析、环境监控和数据挖掘等方面的重要作用,近年来在数据库和网络计算领域受到广泛关注.首先,概述了各种不确定数据类型上的Skyline查询定义,包括离散、连续概率分布模型以及不完全数据上的Skyline查询定义;其次,分析了不确定Skyline查询的特点,并在此基础上综述了现有的各种不确定数据集上的集中式和分布式Skyline查询方法,重点分析了各种算法的原理和优缺点;再次,介绍了不确定数据流上的Skyline查询定义并综述了各种不确定数据流上的Skyline查询方法;最后,基于最新研究动态指出了未来不确定Skyline查询研究的趋势. 相似文献

9.

不确定模式匹配研究综述 总被引：2，自引：1，他引：1

翁年凤刁兴春曹建军冯径《计算机科学》2011,38(12):1-5

模式匹配是数据集成、语义Web等研究领域的重要研究内容,需要依据一定的启发式信息发现模式元素之间的对应关系。鉴于启发式信息处理方法的不同,对模式匹配方法进行了分类,并从模式匹配结果集结方法的角度,介绍了综合模式匹配方法。不确定性是模式匹配过程固有的特性,介绍了建模模式匹配过程中不确定性的数据模型,在此基础上介绍了处理模式匹配过程中不确定性的模式匹配方法。最后对模式匹配研究进行了展望。相似文献

10.

基于密度的不确定数据离群点检测研究

洪沙林佳丽张月良《计算机科学》2015,42(5):230-233, 264

针对不确定数据集进行离群点检测,设计了基于密度的不确定数据的局部离群因子(Uncertain Local Outlier Factor,ULOF)算法.通过建立不确定数据的可能世界模型来确定不确定对象在可能世界中的概率.结合传统的LOF算法推导出ULOF算法,根据ULOF值判断不确定对象的局部离群程度;然后对ULOF算法的效率性和准确性进行了详细分析,提出了基于网格的剪枝策略、k最近邻查询优化来减少数据的候选集;最后通过实验证明了ULOF算法对不确定数据检测的可行性和效率性,优化后的方法有效地提高了异常检测准确率,降低了时间复杂度,改善了不确定数据的异常检测性能. 相似文献

11.

不确定数据库中减小可能世界的RPW—kBest查询

孙平平刘方爱《微机发展》2011,(10):70-72,76

不确定数据普遍存在于大量应用之中,如在传感器网络、P2P系统、移动计算及RFID（Radio Frequency IDentification）等,研究者已经提出了多种针对不确定数据库的数据模型,其核心思想都源自于可能世界模型。针对可能世界模型能够演化出数量远大于不确定数据库规模的可能世界实例,文中提出一种减小可能世界的RPW—kBest算法,此算法利用概率和评定条件进行筛选,尽可能将不影响查询结果的数据抛弃,使之在最小的搜索空间内完成查询处婵过程,以降低存储开销。实验结果表明,此算法能正确的得到查询结果并显著提高查淘效率和降低内存使用。相似文献

12.

Continuous Outlier Monitoring on Uncertain Data Streams

下载免费PDF全文

曹科研王国仁韩东红丁国辉王爱侠石凌旭《计算机科学技术学报》2014,(3):436-448

Outlier detection on data streams is an important task in data mining. The challenges become even larger when considering uncertain data. This paper studies the problem of outlier detection on uncertain data streams. We propose Continuous Uncertain Outlier Detection （CUOD）, which can quickly determine the nature of the uncertain elements by pruning to improve the efficiency. Furthermore, we propose a pruning approach -- Probability Pruning for Continuous Uncertain Outlier Detection （PCUOD） to reduce the detection cost. It is an estimated outlier probability method which can effectively reduce the amount of calculations. The cost of PCUOD incremental algorithm can satisfy the demand of uncertain data streams. Finally, a new method for parameter variable queries to CUOD is proposed, enabling the concurrent execution of different queries. To the best of our knowledge, this paper is the first work to perform outlier detection on uncertain data streams which can handle parameter variable queries simultaneously. Our methods are verified using both real data and synthetic data. The results show that they are able to reduce the required storage and running time. 相似文献

13.

Computing rarity on uncertain data

JIN CheQing ZHOU MinQi ZHOU AoYing 《中国科学:信息科学(英文版)》2011,(10):2028-2039

相似文献

14.

不确定数据流上的并行Skyline查询算法

王广东王意洁李小勇王媛《计算机科学与探索》2012,(12):1116-1125

不确定数据流上的Skyline查询技术逐步引起研究者的关注,传统的集中式流处理算法难以满足海量数据的查询需求,并且云计算所提供的海量计算资源和有效的存储管理模式,为研究并行Skyline查询技术提供了充足的条件。基于上述事实,提出了一种不确定数据流上的并行Skyline查询算法(parallel Skyline over uncertain data streams,PSUDS)。该算法通过交叉划分滑动窗口的方式,将集中式流查询转化为并行处理,以并行执行的方式来解决集中式算法处理性能不足的问题。大量实验结果表明,该算法具有较好的并行可扩展性。相似文献

15.

不确定数据流上Top-k异常点查询算法

曹科研王国仁韩东红李硕儒《计算机科学与探索》2015,(2):172-181

近几年,随着数据流和不确定数据的产生,不确定数据流上的异常点检测成为新的研究热点。然而,现有的不确定数据的异常点定义中涉及3个参数,这对于用户是非常难设定的,以致不能查询到适合的异常点。在大多时候,用户更想知道最可能是异常点的对象,因此提出了不确定数据流上的top-k异常点查询算法。该算法通过估计数据对象异常点的概率范围而进行剪枝,从而减少了一些不必要的计算,同时增量地计算数据对象异常点的概率范围。在真实数据集和合成数据集上进行了一系列的模拟实验,证明了算法的性能。相似文献

16.

基于高斯模型的不确定数据流Skyline查询方法

祁亚斐王意洁李小勇《计算机研究与发展》2012,49(7):1467-1473

由于数据的动态性及不确定性等特征,使得不确定数据流上Skyline查询研究面临挑战.不确定对象一般采用多元概率密度函数(PDF)表示,现有的不确定数据流Skyline查询方法均采用离散型随机变量建模.然而不确定数据流中的对象可能是连续变化的,离散模型对连续性随机变量难以适用.针对连续PDF建模的不确定数据流Skyline查询进行了研究,提出了基于高斯模型的不确定数据流Skyline查询方法(SGMU),该方法包含2个过程:1)动态高斯建模算法(DGM):对滑动窗口采样并建立高斯模型,将原始的数据流转化为不确定对象PDF的参数流;2)提出了基于高斯树的查询算法(GTS)以建立空间索引结构和执行Skyline查询.实验结果表明,SGMU算法不仅能够对连续型不确定对象进行有效建模以辅助Skyline查询,而且能够有效地减少查询对象个数,提高Skyline查询效率. 相似文献

17.

Classifying Uncertain and Evolving Data Streams with Distributed Extreme Learning Machine

下载免费PDF全文

韩东红张昕王国仁《计算机科学技术学报》2015,(4)

Conventional classification algorithms are not well suited for the inherent uncertainty, potential concept drift, volume, and velocity of streaming data. Specialized algorithms are needed to obtain e?c... 相似文献

18.

面向不确定图的概率可达查询 总被引：1，自引：0，他引：1

袁野王国仁《计算机学报》2010,33(8)

图的可达性查询被广泛应用于生物网络、社会网络、本体网络、RDF数据库和XML数据库等.由于对数据操作时引入的噪声和错误使这些图数据具有不确定性,已经有大量的针对不确定RDF和XML数据库的研究.文中使用可能世界语义模型构建不确定图,基于该模型,研究了概率可达查询(PR).处理PR查询是#P完全问题,对此文中首先给出一个基本随机算法,可快速地估算出可达概率,并且该值有很高的精确度.进一步,文中为随机算法引入条件分布(称为"条件随机算法"),采用图的不相交路径集和割集作为条件概率分布,因此改进的随机算法可准确地并且是在多项式时间内处理查询.最后基于真实不确定图数据的大量实验结果验证了文中的设计. 相似文献