首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
为了有效保障外包数据的安全性,满足用户高效检索储存在云中的数据。提出一种基于同态加密的云存储全文检索方案。该方案以整数向量加密技术为基础,建立向量空间模型,进而在密文下计算检索向量与文档向量的余弦相似度,进行检索。方案利用加密算法的同态性,在上传文件,检索以及下载文件的整个过程中,云服务器均无法获取明文数据,方案可进行多关键词检索。在第三方不可信云存储场景中具有准确和更高的检索效率,方案描述简单,保证了用户数据的机密性,在实际场景中具有良好的应用。  相似文献   

2.
向量空间模型(VSM)是一种效果较好的信息检索模型。本文提出了利用向量空间模型实现对文本情报快速检索的方法。在阐述建立分类情报的索引词向量的基础上,讨论了利用索引词向量映射文本情报和存储文档向量矩阵的方法,并通过实例介绍了如何通过计算检索向量和文档向量矩阵的相关度来确定返回的检索内容。  相似文献   

3.
因特网诞生以来,网络信息资源急剧增长,如何利用数据检索技术有效的发现和使用资源成为急待解决的问题.对如何更好的检索XML等结构文档,已经作了大量的研究,提出了许多有效的查询方法,但目前对结构文档的索引结构及存储的研究却比较少,因此本文探讨了XML文档检索模型存储结构的主要技术问题,并提出了对置入表进行压缩编码的一种基于数据库存储的方案.  相似文献   

4.
随着XML技术的发展,如何利用现有的数据库技术存储和查询XML文档已成为XML数据管理领域研究的热点问题。本文介绍了一种新的文档编码方法,以及基于这种编码方式提出了一种新的XML文档存储方法。方法按照文档中结点类型将XML文档树型结构分解为结点,分别存储到对应的关系表中,这种方法能够将任意结构的文档存储到一个固定的关系模式中。同时为了便于实现数据的查询,将文档中出现的简单路径模式也存储为一个表。这种新的文档存储方法能够有效地支持文档的查询操作,并能根据结点的编码信息实现原XML文档的正确恢复。最后,对本文提出的存储方法和恢复算法进行了实验验证。  相似文献   

5.
针对应用系统的数据转换需求,分析数据转换的架构、XML数据在关系数据库中的存储,提出并论证了基于关系数据库的数据转换架构,并给出具体的实现算法。所提出的算法能比较完整地存储任何一篇XML文档,并较好地支持基于元素和文档片段的查询和检索。通过将XSL技术引入到该数据转换槊构中,在保证XML信息存储完备性的基础上,提高了在关系数据库中的查询检索速度。这种架构利用XML技术解决了进行各种数据转换带来的问题,实践证明该技术大大提高了系统的灵活性和可扩展性。  相似文献   

6.
随着互联网数据爆炸式的增长,信息检索系统逐步采用分布式多数据源架构存储数据,在关键字检索时,选择与用户查询的关键字相关度大的数据源进行查询对提高检索效率显得格为重要.提出一种基于关键字检索的XML数据源选择方法,针对XML文档结构的层次特性,提出一种递归定义的结果评分模型,将结点的关键字频率与路径长度递归地加入到评分模型中,使得评分模型能够准确地评判结果的优劣.同时,利用评分模型定义并提取了XML数据源的摘要,并给出了摘要存储中涉及的压缩、优化、更新等问题的解决方案及算法.根据摘要信息,提出4种数据源选择的方案,并使用DBLP数据集来验证了文章所提出的数据源选择算法的有效性.  相似文献   

7.
有效地检索HTML文档   总被引:22,自引:1,他引:21  
WWW上的资源大多以HTML格式的文档存储,同普通文档不同,THML文档的标签特性使得它具有一定的结构我们采取了一种检索,它扩展了传统的传统检索,利用HTML文档结构提高了在WWW环境下的检索和率。本文介绍了HTML的结构以及传统的向量空间信息检索提出了运用聚族方法为标符合分组;最后详细讨论了如何利用文棣结构扩展加权架,使得检索词能更贴切地描述文档,以提高检索的准确性。  相似文献   

8.
基于OLE的PDM系统图形文档信息的处理   总被引:2,自引:0,他引:2  
文章首先介绍了PDM(Product,Data Management,产品数据管理)系统中处理图文档信息的重要性,指出了处理信息的两种方法。在详尽分析了两种处理图文档信息方法的基础上,重点介绍了如何在Powerbuilder中利用OLE技术实现信息在数据库中的存储和检索,并通过部分源程序说明了该方法的实现途径。  相似文献   

9.
为了实现基于语义的密文检索,提高密文检索的准确率和效率,本文提出了一种基于biterm主题模型(biterm topic model, BTM)的多关键词可排序对称可搜索加密方案(BTM-MRSE).通过主题模型对关键词和文档之间的潜在语义进行建模,用户利用查询关键词的概率分布作为检索陷门,根据查询关键词与文档之间的语义相关性得分来获得最相关的文档.本方案将密文检索中的特定关键词替换为基于语义的主题,实现了关键词和文档标识符的分离,从而增强了文档关键词与查询关键词的隐私保护.为了减小索引规模,我们提出两层索引结构,利用平衡二叉树构造关键词-主题安全索引,结合倒排索引构造主题-文档安全索引.一方面,主题模型减小了索引节点中向量的维数,从而提高了检索效率,同时基于平衡二叉树的二级索引机制也进一步改善了密文检索效率.安全性分析证明了所提方案是安全有效的,同时利用真实数据集进行实验对比,表明本方案的密文检索准确率和效率都有极大提升.  相似文献   

10.
基于分布式多级目录的NetFlow流数据检索   总被引:1,自引:0,他引:1       下载免费PDF全文
对于网络流量工程而言,需要解决如何存储并高效地检索大量的网络流量数据。该文提出利用分布式多级目录技术实现NetFlow网络流数据信息存储与检索的一个完整方案,讨论NetFlow流数据的存储方式以及对其进行检索的优化方案,给出该系统的工作流程和框架、对流数据查询检索的部分数据结构及其工作方式。  相似文献   

11.
互联网技术的发展产生的海量非结构化数据在传统关系型数据库中难以被高速有效地进行存储和处理,各类NoSQL数据库可以有效存储处理非结构化数据,但是对关系运算功能的弱化难以满足应用场景的需求。具备非结构化数据处理能力的新型关系型数据库提供了适用多种应用场景的高效存储方式。为了能够定量地比较关系型数据库和面向文档的NoSQL数据库的数据存储与处理能力,比较了PostgreSQL的hstore数据类型和MongoDB的内嵌文档对非结构化数据的储存方式,并通过非结构化数据的批量加载、磁盘占用、主键查询、非主键查询、地理空间坐标查询等方面的对比来以分析性能特征与适用场景。  相似文献   

12.
为解决关系型数据库在大数据处理中遇到的瓶颈问题,满足企业对大数据处理的需求,提出将关系型数据库迁移到NoSQL文档型数据库中。针对RDBMS中的关系模型向MongoDB中的集合模型转化方法进行了研究,提出了表示关系间参照完整性的有向图表示模型,和基于关系型数据模型向MongoDB文档模型自动转化算法;实现了RDBMS中迁移数据到MongoDB的插入算法。针对上述方案和算法,结合典型开源RDBMS--MySQL实例,对上述关系有向图模型的生成、基于有向图模型的转化算法以及数据迁移算法应用验证。实验结果表明RDBMS可以按照一定的数据结构平滑地迁移到MongoDB中。  相似文献   

13.
由于硬件升级和WiFi的广泛覆盖,网络应用业务和服务在Web端和智能移动终端并驾齐驱,用户也经常在两者之间切换,因此,支持跨平台自适应于Web端和移动终端的网络应用研发技术是当今的一个热点.Ionic框架技术通过前端交互设计,逻辑控制设计,调用系统原生接口完成应用软件的研发;AngularJS框架技术通过强大的视图数据双向绑定功能,自定义指令扩展功能,灵活的数据处理功能,增强HTML的动态应用;MongDB数据库技术借助数据库、集合、文档作为存储单元实现单服务器部署和多数据中心架构.本文研究怎样组合Ionic框架、AngularJS技术实现自适应前端页面的设计,研究了MongDB的存储原理和它内置文件系统GridFS存储文件的工作原理,以及它内置分片系统Sharding对松散数据结构的支持和存储数据的强扩展性原理,并采用研究的结果设计实现了一款自适应于Web端与移动终端的应用软件,为用户在Web端和移动端切换带来了简便,实现了良好的用户体验.  相似文献   

14.
MongoDB数据库中Sharding技术应用研究   总被引:1,自引:0,他引:1  
非关系型数据库的出现,对于解决面向文档的超大规模和高并发的问题提供了卓有成效的解决方案。MongoDB为了提高处理大数据量的性能,提供了分片集群的功能,支持自动分片和划分架构,可以利用它构建一个水平扩展的数据库集群系统,将数据库分表存储在各个Sharding节点上。文中在研究MongoDB特性的基础上,着重分析Sharding技术的应用,通过比较普通和分片这两种情况下的性能测试,提出使用MongoDB中的Sharding技术来解决随着数据量增加带来的数据库的读写性能和效率的问题。  相似文献   

15.
近年来气象数据呈现多源化和爆炸式增长的态势,传统的关系型数据库已不能满足气象数据发展的需求。结合气象数据的地理空间特点,提出一种基于MongoDB的气象数据存储检索系统。本系统对气象数据建立空间索引,加快了气象数据的查询效率,为精细化、格点化预报提供了有力的支撑。实验结果表明,对于海量的气象数据,MongoDB具有强大的存储和检索能力,各个方面的性能明显优于关系型数据库。  相似文献   

16.
随着媒体技术及网络的普及与发展,获取某一主题的信息量批量增长,数据形式也呈现多样化,如何存储与管理批量及多样化的数据引起重视,其中基于云数据的管理技术是目前最热门的研究领域。从云数据管理技术的特点出发,以石油文化数据库建设为例阐述数据库建设的基本流程,提出基于MongoDB的石油文化数据库建设模型。  相似文献   

17.
电力信息化的发展对传统电力信息系统的数据处理、并发请求及响应能力提出诸多挑战.针对电力信息系统数据处理的特点,提出一种基于MongoDB数据库的分布式缓存,并对该分布式缓存的运行机制、服务端架构和客户端功能模块的设计进行了分析与阐述.基于MongoDB的分布式缓存能够有效地降低电力信息系统数据库层的访问负载量,提高系统的整体性能,它采用分布式文件存储缓存数据,支持数据冗余备份和故障恢复功能,具有较高的可靠性和扩展性.基于MongoDB的分布式缓存已成功应用到电力某企业的项目管理系统中.  相似文献   

18.
Future factories will feature strong integration of physical machines and cyber-enabled software, working seamlessly to improve manufacturing production efficiency. In these digitally enabled and network connected factories, each physical machine on the shop floor can have its ‘virtual twin’ available in cyberspace. This ‘virtual twin’ is populated with data streaming in from the physical machines to represent a near real-time as-is state of the machine in cyberspace. This results in the virtualization of a machine resource to external factory manufacturing systems. This paper describes how streaming data can be stored in a scalable and flexible document schema based database such as MongoDB, a data store that makes up the virtual twin system. We present an architecture, which allows third-party integration of software apps to interface with the virtual manufacturing machines. We evaluate our database schema against query statements and provide examples of how third-party apps can interface with manufacturing machines using the VMM middleware. Finally, we discuss an operating system architecture for VMMs across the manufacturing cyberspace, which necessitates command and control of various virtualized manufacturing machines, opening new possibilities in cyber-physical systems in manufacturing.  相似文献   

19.
一种XML Schema模式到关系模式的映射算法   总被引:4,自引:0,他引:4  
XML文档数据如何存储在主流的关系数据库中,对企业信息集成起着至关重要的作用。针对此问题,提出一种XML Schema模式到关系模式的约束保留映射算法——XSD2RS,该算法基于模式对象组件建模和约束保留机制来完成XML Schema模式到关系模式的映射,进而实现XML文档数据在关系数据库中的存储。  相似文献   

20.
近年来,随着计算机技术与无线传感器网络的发展,轨迹大数据越来越得到人们的关注.针对海量轨迹数据在存储与查询中出现的效率问题,文章基于文档型非关系型数据库MongoDB提出了一套基于四叉树的道路网时空索引,实现海量轨迹数据的高效查询.通过对太原市1915辆出租车的50万条轨迹数据进行时空查询,在不同数据量与不同并发数下测试道路网时空索引与MongoDB复合时空索引的效率表现.实验结果显示道路网时空索引在数据量大于10万时有较好表现,并能够适应不同并发数下的时空查询,验证了道路网时空索引构建方法的可行性和高效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号