共查询到19条相似文献,搜索用时 140 毫秒
1.
半结构化数据查询重写 总被引:10,自引:1,他引:10
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,信息集成,语义缓存等问题紧密相关,目前Internet上存在海量的半结构化数据,在信息集成过程中产生了大量半结构化视图,如何利用物化半结构化视图来重写用户查询,减少响应时间成为研究热点问题,上述问题本质上是NP问题,提出了一种半结构化查询重写的新方法,该方法在保证算法正确性和完备性的基础上,利用半结构化数据特点和查询子目标之间的关系,减少了指数空间的查询重写候选方案生成,理论分析表明,它极大地降低了算法的代价。 相似文献
2.
半结构化、层次数据的模式发现 总被引:10,自引:0,他引:10
Web数据资源及数据集成引发了半结构化数据问题,半结构化数据指其结构隐含或不规整的自描述数据。由于缺乏独立于数据的模式,有效地查询划浏览该类数据比较困难,半结构化数据的模式发现成为解决该问题的基础步骤。本文提出的算法能够快速有效地发现半结构化层次数据中的规整结构。它采用自顶向下的生成,结合有效的剪枝策略,从OEM模型表达的半结构化层次数据中构建模式树。 相似文献
3.
基于语义对象模型的无结构化数据集成的研究 总被引:1,自引:2,他引:1
数据集成是为了屏蔽数据的异构性,以一种统一的接口访问数据源中的数据。由于无结构化数据没有外在的模式定义,因此基于模式的集成不能适用于流媒体、图形、图像等无结构化数据的集成。该文借鉴面向对象建模方法的思想,提出了语义对象模型的概念,并基于该模型描述了一个集成应用系统的体系结构。 相似文献
4.
在分析现有的半结构化数据的存储方式及存在的问题基础上,引入了小集合属性、集合属性、聚类集合、模板集合、父属性序列等概念,借助映射表达语言STORED,提出了一种基于数据挖掘的半结构化数据到结构化数据的模式抽取的方法。 相似文献
5.
随着大数据时代的来临,结构化数据的种类、规模不断增加,但是目前针对于结构化数据的注册还没有相应的研究成果。为了解决结构化数据注册的问题,采用数据架构(DA)的思想和相关技术,结合数据注册中心(DRC),设计一种针对结构化数据的注册引擎,提出一种结构化数据的统一注册标准和注册方法,实现结构化数据的自动采集注册。通过实验与分析,注册引擎能够准确、高效地将结构化数据注册信息采集并写入DRC中,为国内外常用数据库的注册问题提出了一种解决方案,为DRC数据注册中心的结构化数据注册信息管理和应用奠定了坚实的基础。 相似文献
6.
为实现对不同类别半结构化数据的精准识别,文章将开展基于大数据和物联网的数据库半结构化数据识别方法的设计研究。笔者通过从各种来源收集数据,包括传感器、日志文件、社交媒体平台、其他数据库等,对半结构化数据所在数据库进行联网,使用大数据中的数据清洗技术进行半结构化数据预处理;对完成预处理的数据库半结构化数据进行特征提取,根据具体的数据识别问题确定模型架构,生成数据识别模型,并实现对半结构数据的识别。对比实验结果表明:设计的方法可以实现对数据库半结构化数据的精准识别。 相似文献
7.
柏森 《计算机与信息技术》2007,(5)
半结构化数据是网络中一种重要的数据形式,也是进行数据挖掘的重要基础。因此要对Internet上巨量的数据进行数据挖掘,半结构化数据及模型是前提。本文介绍了半结构化数据的相关概念及其数据模型。 相似文献
8.
为了提高物联网通信大数据库的运行速度与处理效率,提出一种物联网通信大数据库半结构化数据识别方法,通过计算大数据库内数据的稀疏度系数与划分系数子空间,获得不同种类数据的关联特性,根据半结构化数据结构得到该其储存节点坐标,使用主成分分析和德尔菲算法融合集成转换为综合加权法,赋予识别半结构化数据得到指标权重,根据Tanimoto系数度量半1结构化数据的相似性并优化参数,实现识别大数据库内的半结构化数据.实验证明,通过所提识别方法处理后的数据重写率大幅度降低,且识别结果与真实结果差值较小,具有一定实际应用价值. 相似文献
9.
基于OEM模型的半结构化数据的模式发现 总被引:1,自引:1,他引:0
随着Web数据和数据集成技术的飞速发展,半结构化数据越来越引起人们的重视。半结构化数据是指那些具有隐含结构或结构不严谨的自描述数据。它不同于传统数据中的模式,它是先有数据后有模式,而且半结构化数据的模式是用于描述数据的结构信息而不是对数据结构进行强制约束。为此,半结构化数据的模式发现就成为知识发现的首要步骤。采用了层次数据的概念,提出了分层事务数据库和“累加变换”的计数原则,并据此提出了基于SHDP-tree树结构的SHDP-mine算法和挖掘出半结构、层次数据的基本模式。最后从理论和实验分析和验证了它的有效性和高效性。 相似文献
10.
11.
景区智能导游系统中语音解说技术分析研究 总被引:1,自引:0,他引:1
本文探讨了应用于旅游景区的智能导游系统语音解说的技术,讨论了景点数据的存储、景点数据匹配和语言解说的可能性。在获取景点数据方面,提出了两种确定景点解说范围的方法,并通过软件编程解决了语音重复播放问题。 相似文献
12.
13.
文章第1节对软件流水下多重循环中数据元素的调度进行了分析,着重讨论了用地址计数器完成简单地址运算的意义、ILSP(interlaced inner and outer loop software pipelining)算法的基本思想及其在此基础上分析了软件流水下多重循环中数据元素的调度特点;第2节进一步探讨了为完成调度而寻找地址控制信息序列的一般方法;第3、4节则分别讨论了用求得的地址控制信息序列控制地址计数器对数据元素的访问和将地址控制信息序列化简为精简地址控制信息序列的步骤;最后两节分别是实验结果和结 相似文献
14.
15.
武健 《计算机工程与应用》2016,52(5):61-64
针对高校校园网受考生及家长关注度越来越高的现象,为深入分析和理解用户的访问模式及其访问热点的变化规律等知识,设计一种隐马尔科夫模型和分层聚类策略相结合的混合聚类算法。基于隐马尔科夫模型将时序数据转换到似然空间,其中似然度的大小通过对称性KL(Kullback-Leibler)距离来标识。构建对称性KL转移矩阵,并借助于分层聚类方法实现对用户访问模式进行聚类。通过将该方法应用于考生及家长对我校官网访问的网络日志数据挖掘进而得到用户访问的三种模式,表明该方法的可行性和有效性。 相似文献
16.
针对一种完全国产化的嵌入式MPP系统,通过抽象出系统的数据空间划分、确定系统的数据访问方式以及建立系统的数据映射机制,提出了与体系结构相适应的、与存储方式无关的数据操作策略。实验结果表明,该数据操作策略能够实现异构系统间高效、正确地数据交换。 相似文献
17.
数据访问技术的解析与探讨 总被引:1,自引:1,他引:0
回顾了数据访问技术的演变,着重描述了ADO和ADO.NET对象结构并进行比较分析,在此基础上给出了几种与MS SQL Server 2000数据库连接的Web访问实例。 相似文献
18.
Lotus Notes是基于文档的非结构化数据,关系数据库采用结构化数据,Lotus Notes使用ODBC标准存取关系数据库信息。本文以SYBASE数据库为例,介绍了在Lotus Notes中访问外部关系型数据库的具体实现方法。 相似文献
19.
提出了以四叉树作为缓存数据结构,结合广泛应用的LRU和LFU算法,给出了一种高效的缓存策略—基于四叉树的空间数据缓存策略,并详细描述了缓存框架和缓存策略。提出的缓存策略充分考虑了空间数据访问所具有的时间局部性和空间局部性,兼有LRU和LFU算法的优点。最后设计了空间数据请求模型,通过实验对算法的有效性进行了验证。 相似文献