首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 484 毫秒
1.
针对粗关系数据库中数据的特性,提出一种不确定性数据的存储方法。基于汉明距离的一种变式,计算元组间距离,构成距离矩阵,根据距离矩阵将相同或相近的元组归类,从而有效地对表中的元组进行索引。借助粗集中的上、下近似,通过计算用户查询的数据与粗关系数据库中数据的相似度,查询出用户所需的数据。结合以上方法构建粗关系数据库查询模型,设计相应的查询算法并应用于实例中。  相似文献   

2.
逐维聚类的相似度索引算法   总被引:5,自引:0,他引:5  
随着多媒体信息技术的迅速发展,多维度索引技术在图像、视频等可视信息的存储、检索方面成为一个重要的研究领域,针对“维数危机”难题,提出逐维聚类相似度索引算法,该算法根据数据集的分布特性,对特征矢量的每一维进行聚类,算法在实现检索时可以逐步滤除与查询矢量不相似的数据集,缩小检索范围,进而提高了检索速度,实验结果表明,逐维聚类算法适用于基于相似度的高维数据矢量检索和查询,是一种简单、灵活的索引结构。  相似文献   

3.
为解决流程工业中过程历史数据的存储以及大量数据的快速查询问题,提出一种基于关系数据库的磁盘历史数据库模型。在数据存储方案设计中,将关于位号和数据采集接口的静态信息存储在关系数据库中,历史数据以文件形式存放,采用三重二级缓存机制避免频繁访问磁盘,并使用经典的SDT算法对实时数据进行压缩存储,降低存储成本。数据查询方案采用三级索引文件结构,即总索引文件、二级索引文件和位号索引文件,提高查询效率。该磁盘历史数据库的第一版已经成功实现,应用结果表明,数据存储方案和查询方案的设计是合理的,100个位号的查询时间约为500 ms。  相似文献   

4.
海量URL会造成网络内容过滤系统索引效率低下。该文提出一种基于CPat-Tree改进的URL分级信息存储模型的裁剪算法,通过键值相似度实现键聚类,直接对存储数组遍历以合并相似的叶子节点,减少索引占用空间,提高查询效率。该方法裁剪前后的存储空间变化效果取决于键相似度,因此其具有良好的扩展性。  相似文献   

5.
关系数据库具有成熟的索引、存储、查询技术,将XML数据存储到关系数据库中将极具意义。但是,XML数据复杂的层次结构和关系数据库扁平的表达结构之间的不匹配,使得在存储过程中出现了很多复杂的问题。从上述应用背景出发,文章提出了一种基于模型映射以及嵌套集合模型(Nested Sets Model)的通用的关系存储模型以及查询算法。通过实验并且分析了在各个查询场景下实验数据的正确性以及性能情况后表明,该中间件能够使XML数据在关系模式中有效存储,并且能够有效地满足查询要求。  相似文献   

6.
针对当前无线传感器网络中数据查询通信开销大而带宽资源有限的问题,提出了一种基于局部聚类的数据存储模型.该模型通过将整个网络按地理位置划分区域,采用局部数据聚集存储,避免了将同种数据发送至一个存储点存储所造成的巨大通信开销,从而均衡通信带宽.在数据存储模型之上,提出了一种基于空间索引的数据查询方法(SIQ).在SIQ中只利用存储节点构建成索引的叶子节点,与利用所有节点建成的索引相比,其维护的节点数量少,索引的构建成本降低.同时SIQ采用数据属性为空间索引内容,有效地对监测数据进行多维属性的范围查询.仿真结果表明,与较成熟的DD算法和GHT算法相比,SIQ方法能克服泛洪查询所引起的高通信复杂度.  相似文献   

7.
为了有效地管理多媒体信息、地理信息及空间数据,提出了多种针对多维数据的索引方法。其中一些索引方法已经在现有的商用数据库系统(DBMS)得以实现,然而学术研究及实际应用中需要更多种的多维乃至高维数据索引方法的支持。有研究提出在关系数据库上利用存储结构、存储过程、触发器来模拟并实现X_tree的多维数据索引功能。在此基础上加以改进,重新设计了模式结构,增加了关键的索引,引入了聚簇存储,以关系模式实现多维索引的创建、插入、查询等操作;并且与现有的商用数据库系统的多维索引Oracle Spatial进行了插入、查询的性能比较。实验结果充分证明这种以关系模式实现多维索引方法的可行性与可用性。  相似文献   

8.
针对应用系统的数据转换需求,分析数据转换的架构、XML数据在关系数据库中的存储,提出并论证了基于关系数据库的数据转换架构,并给出具体的实现算法。所提出的算法能比较完整地存储任何一篇XML文档,并较好地支持基于元素和文档片段的查询和检索。通过将XSL技术引入到该数据转换槊构中,在保证XML信息存储完备性的基础上,提高了在关系数据库中的查询检索速度。这种架构利用XML技术解决了进行各种数据转换带来的问题,实践证明该技术大大提高了系统的灵活性和可扩展性。  相似文献   

9.
基于关系数据库的位置相关查询处理   总被引:2,自引:0,他引:2  
随着无线通信技术以及全球定位技术的发展,位置相关的查询处理及基于位置的信息服务技术已经成为一个热点研究领域,作为支持位置相关查询的一项关键技术,位置相关数据的处理也正在引起人们日益广泛的关注,对位置相关数据处理中的关键技术进行了分析,提出了一种基于关系数据库的位置相关数据的存储及表示方法,同时提出了一种可变粒度格栅索引方法用于对位置相关数据的数据区域进行索引,在此基础上,研究了相应的查询处理算法,为了测试相应算法的性能,设计并实现了一个原型系统,实验结果表明,所提出的方法具有灵活的表示能力、快捷的查询性能以及良好的可扩充性。  相似文献   

10.
随着移动传感器设备的普及,人们能够采集到的位置数据越来越多,轨迹数据的规模也越来越庞大.从大规模时空数据中查找与指定轨迹最相似的前k条轨迹一直是时空大数据挖掘的重要挑战之一.现有的相似轨迹查询方法大都包括三个阶段:(1)对海量的离线轨迹数据建立索引;(2)基于索引结构从已知轨迹集中查询与指定轨迹相似的候选轨迹;(3)计算指定轨迹与候选轨迹之间的精确相似度并返回相似度最大的前k条轨迹.但大多数现有方法对轨迹进行聚类索引时不能有效利用时间和空间信息,导致时间相似度不高的轨迹也会被划分到相同的索引项上,最终影响查询的准确性和效率.此外,现有的时空轨迹相似度计算方法存在大量的无效运算,使得相似轨迹的查询效率整体较低.针对当前伴随轨迹查询方法对时间与空间信息利用不充分的问题,本文提出一种新的二级时空分桶索引结构,首先将每条轨迹数据按照时间滑动窗口划分为若干带有时间槽信息的子轨迹,在时间上对轨迹进行一级索引聚类;在此基础上对在相同时间槽内的子轨迹进行二级空间索引聚类,利用哈希算法将具有连续相同位置点的子轨迹映射到同一时空分桶中.与已有索引方法相比,该方法对不同轨迹在索引时具有更好的区分度,查询时的...  相似文献   

11.
根据粗关系数据库中数据的特性,借助邻接表、十字链表存储不确定性数据,其中邻接表用于等价类的存储,十字链表用于数据库中基本表的存储。与传统的关系数据库更新不同,在粗关系数据库中更新基本表时,相应地等价类也要随之更新,该存储结构加快了对数据库中的数据更新速度。将算法与实例相结合,根据用户条件详细地讨论对等价类和RRDB中基本表的数据更新。  相似文献   

12.
魏玲玲  邱桃荣  陈霞 《计算机工程与设计》2007,28(17):4213-4214,4228
Rough关系数据库模型(rough relational database model,RRDM)是对关系数据库模型的一种扩展,它具有在很大程度上比较符合真实世界情况的特性.介绍了Rough集和Rough关系数据库(rough relational database,RRDB)等相关概念,着重讨论如何在RRDB中通过Rough集中的上、下近似计算数据间的相似度来检索出需要的数据,给出了相关算法和实例分析.  相似文献   

13.
利用粒计算方法对粗糙关系数据库(Rough Relational Database,RRDB)的粗糙函数依赖进行研究。首先提出了两种类型的粗糙函数依赖及粗糙相似关系的概念,分析了如何利用位模式表示粗糙关系的属性值,在此基础上给出了利用粒计算方法对粗糙关系的属性间的依赖关系的进行判定的算法,实验验证算法是有效可行的。  相似文献   

14.
基于粗糙集和决策树的增量式规则约简算法   总被引:2,自引:0,他引:2  
粗糙集方法是一种处理不确定或模糊知识的重要工具。传统的粗糙集模型对最简规则集的研究都是针对静态数据的,对于动态数据却显得无能为力。但在实际应用中,数据库中的数据往往是动态变化的,因此,对规则约简的增量式算法的研究是知识发现领域所急需解决的问题之一。文章给出了一种基于粗糙集和决策树的增量式规则约简算法,并与传统算法和RRIA算法进行了对比分析,实验结果表明该算法的方法和效果更好。  相似文献   

15.
属性约简能有效地去除不必要属性,提高分类器的性能。模糊粗糙集是处理不确定信息的重要范式,能有效地应用于属性约简。在模糊粗糙集中,样本分布的不确定性会影响对象的近似集,进而影响有效属性约简的获取。为有效地定义近似集,文中提出了基于距离比值尺度的模糊粗糙集,该模型引入了基于距离比值尺度的样本集的定义,通过对距离比值尺度的控制,避免了样本分布不确定性对近似集的影响;给出了该模型的基本性质,定义了新的依赖度函数,进而设计了属性约简算法;以SVM,NaiveBayes和J48作为测试分类器,在UCI数据集上评测所提算法的性能。实验结果表明,所提出的属性约简算法能够有效获取约简并提高分类的精度。  相似文献   

16.
Abstract: The growing volume of vague information poses interesting challenges and calls for new theories, techniques and tools for analysis of vague data sets. In this paper, we study how to extract knowledge from vague objective information systems (VOISs) based on rough sets theory. We first introduce the basic notion termed rough vague sets by combining rough sets theory and vague sets theory. By using the rough vague lower approximation distribution in the VOIS, the concept of attribute reduction is introduced. Then, we develop an algorithm based on a discernibility matrix to compute all the attribute reductions. Finally, a viable approach for extracting decision rules from the VOIS is proposed. An example is also presented to illustrate the application of the proposed theories and approaches in handling medical diagnosis problems.  相似文献   

17.
徐怡  肖鹏 《计算机应用》2019,39(5):1247-1251
针对不完备信息系统变化时缺失值获取具体属性值的特性,为解决多粒度粗糙集中更新近似集时间效率低的问题,提出了一种基于容差关系的近似集动态更新算法。首先,讨论了基于容差关系的近似集变化的性质,并根据相关性质得出乐观、悲观多粒度粗糙集的近似集的变化趋势;然后,针对更新容差类效率低的问题,提出了动态更新容差类的定理;最后,在此基础上,设计出基于容差关系的近似集动态更新算法。采用UCI数据库中4个数据集进行仿真实验,当数据集变大时,所提更新算法的计算时间远小于静态更新算法的计算时间,即所提动态更新算法的时间效率高于静态算法,验证了所提算法的正确性和高效性。  相似文献   

18.
基于相容粗糙集的图形图像信息预检索   总被引:8,自引:0,他引:8  
早期的利用粗糙集理论进行信息检索都是以“等价粗糙集模型”为基础的,但是等价粗糙集的性质限制了该方法的应用范围,为此有些研究者提出以“相容粗糙集模型”代替“等价粗糙集模型”的新的信息检索的概念,此概念的关键在于“关键词的同时发生”和关于相容粗包含的“匹配算法”,提出了一种利用“相容粗糙集”的理论对图形图像进行预检索的新方法,即在相容类的近似空间里对图形图像进行预检索。为了验证这种新方法的有效性,在人脸图形和图像库中做了若干实验,实验结果表明,该方法可以有效地克服等价粗糙集在图形图像检索方面的限制,对提高图形图像的检索效率具有一定的作用。  相似文献   

19.
为了提升风险决策环境下协同训练的效果, 提出了一种基于粗糙子空间的协同决策算法。首先利用粗糙集属性约简的概念, 将部分标记数据属性空间分解为两差异性较大的粗糙子空间; 在各子空间上训练分类器, 并依据各分类器决策风险代价及隶属度将无标记数据划分为可信、噪声和待定样本。综合两分类器的分类结果, 标注少量可信无标记样本后重复协同训练。从理论上分析了算法性能提升的区间界, 并在UCI数据集上进行实验, 验证了模型的有效性及效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号