首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
目前Web上大多是非结构化的信息,检索主要是通过基于体、协会在Web上通过DTD/Schema定义XML(Extensible Markup Language)文档,由于XML描述了结构化的信息,对XML文档的检索也与以往的搜索引擎不同.为此,本文设计了一个新的基于XML文档的智能信息检索原型系统ⅪIRC,给出了它的体系结构及功能,并对用户界面、索引机制、查询机制、检索结果概念聚类等问题进行了探讨.  相似文献   

2.
从实现图片数据库可扩展性的角度,分析了传统关系型数据库解决这一问题的不足之处,提出了一个基于纯XML数据库的解决方案。该方案使用XML格式来描述和存储图片的元数据,利用XML的可扩展性、结构化存储和XML数据库Tamino可以随时修改文档模式,不会破坏数据库中原有的数据,有效地实现了图片数据库的可扩展性,同时使图片数据库具有高效检索和跨平台的特点。  相似文献   

3.
GML空间数据的对象化存储研究   总被引:3,自引:0,他引:3  
GML(GeographyMarkup Language)作为一种存储和交换空间信息的XML编码格式,已逐渐被普遍接受并广泛使用.GML文档用于描述地理数据内容,包括对空间对象的空间几何属性的描述,如点、线串、面等.空间数据是极其庞大的,因而导致GML数据类型繁多,数量巨大.所以一般地将XML文档存入关系数据库管理系统中的方法并不适合GML文档.基于该特性提出并实现了一种将GML数据存储到面向对象数据库管理系统中的方法,该方法更加充分地利用了GML中面向对象的思想,比存入关系数据库更有效,速度更快,所占空间更少.  相似文献   

4.
目的提出一种XML文档存储和查询方法,解决XML文档有效的存储和查询,避免处理XML数据时进行多级复杂的转换.方法充分利用关系数据库成熟技术,有效实现大量数据的存储和查询.采用SAX技术解析XML文档,并通过对现有哈夫曼编码进行扩展,实现将XML文档结点信息和属性以关系结构进行存储和查询.利用扩展后的哈夫曼编码来存储结点信息和结点之间关系.结果通过遍历XML文档生成了XML文档对应扩展哈夫曼编码,实现了XML文档信息以关系数据形式存储和查询,并实现了SQL语句与XML查询语句的转换.结论基于扩展哈夫曼编码结点映射的存储与查询方法能较好地实现结点信息与结点关系的存储,并有效地实现查询,在应用中具有一定可行性.  相似文献   

5.
为了实现对公文处理的有效管理和操作,就要把这些信息转化为规范的数据结构,也就是对其进行标准化管理,并使之适应公文自动管理的要求。在分析现有技术的基础上,提出把常用格式的数据转化为XML文档,并利用原生XML数据库进行存储和检索。  相似文献   

6.
针对海量非结构化时态信息存储与快速检索的需求,提出使用Hadoop 平台下的分布式、非结构化数据库HBase对海量时态数据进行存储,构造以时态集合为时态存储单元的时态数据存储模型;设计了多级分布式哈希索引表算法( tDHT),实现对时态列族的时态属性值的高效、快速的检索。通过将时态属性值向二维空间映射,实现时态数据向空间对象的转化,采用对空间数据的处理方法对时态数据区域进行划分,生成多级时态数据子区域,利用分布式哈希表思想设计HBase存储的多级索引表目录。实验结果表明,该索引策略具有较高的性能,可以在一定程度上加快对HBase中时态信息的检索速度。  相似文献   

7.
提出一种基于XML的文档图像在原生数据库中存储和检索的新方法,该方法将文档图像切分标记为XML文档,将此类XML文档存储到原生数据库中;利用XML:DB API接口对XML数据进行查询和管理,XSL样式表完成XML数据的显示.  相似文献   

8.
介绍了作为XML分析的利器DOM(文档对象模型Document Object Model),论述了由它提供的一个操作XML和HTML文档并与语言无关的标准接口集,以及采用标准规范与之适应的一个接口和类的集合。其中最 重要的是开发语言绑定及其与之相对应的org.w3c.dom Java等。DOM提供了一种用Java创建和修改XML文档的方法,把XML文档描述称为一棵树,并将整个XML文档读入内存,并将所有数据存储在节点中,使得整个文档的方法,把XML文档描述称为一棵树,并将整个XML文档读入内存,并将所有数据储存在节点中,使得整个文档得以快速使用。以Apache Xalan为例, 阐述了进行XML文档的分析和DOM树的生成及DOM树的遍历的技术。  相似文献   

9.
空间索引在嵌入式设备中有广泛的应用,按照不同的空间映射方式,可以分为不同的索引方法,如二叉树索引、网格索引、四叉树索引和R树索引及其变种,指出了各种空间索引的利弊和适用环境.目前嵌入式系统中硬件资源不足,人们对其功能的需求却在不断的增加,因此如何快速的检索到需要的空间数据以满足相应的功能成为了一个亟需的问题.根据各个索引方法优势以及其相关的使用环境,提出了一种四叉树和R*-树相结合的空间索引—QR*-树索引,此空间索引虽然在存储空间上比R*树略有增加,但是在插入、删除、查找等操作中的性能远远优于R*-树,非常适合作为嵌入式系统的数据库空间索引,最后在S3C2440平台上验证了其有效性.  相似文献   

10.
基于XML的智能信息检索与聚类研究   总被引:1,自引:0,他引:1  
目前Web上大多是非结构化的信息,检索主要是通过基于关键词的搜索引擎或目录浏览。近来,许多组织、团体、协会在Web上通过DTD/Schema定义XML(Extensible Markup Language)档,由于XML描述了结构化的信息,对XML文档的检索也与以往的搜索引擎不同。为此,本文设计了一个新的基于XML文档的智能信息检索原型系统XIIRC,给出了它的体系结构及功能,并对用户界面、索引机制、查询机制、检索结果概念聚类等问题进行了探讨。  相似文献   

11.
针对可扩展标记语言(XML)数据查询中的结构化匹配问题,提出一种位图过滤加速法,该算法能有效地提高XML结构化匹配效率。通过预先为每个XML节点建立标签位图,该加速法在XML结构化匹配中,能以位图比较形式过滤大部分未匹配节点,从而达到加速效果。研究位图过滤加速法与几类XML结构化匹配算法的集成问题,提出了低代价的融合方法。实验证明,集成位图过滤加速法的XML结构化匹配算法在查询效率方面明显优于原有算法。  相似文献   

12.
关系数据库转换为XML文档的新方法   总被引:3,自引:1,他引:2  
提出一种在保存数据约束条件下,把关系数据库信息转换为XML文档,并在得到的XML文档信息中能完整地体现所保存的数据约束的新方法。解决了只注意数据结构的无损转换,而忽略数据约束的保存问题。具体做法是:为使关系模式与XML模式相互兼容,把关系数据库中存在数据联系的关系合并成一个新关系;把每个新关系按其数据的约束条件转换为XML文档树后,将多个XML合并成一棵XML文档树;在此树上可根据实际需求选择整个(部分)XML文档树转换为XML文档。  相似文献   

13.
Data Caching for XML Query   总被引:1,自引:0,他引:1  
Webapplicationssupportedbydatabaseretrieve desiredinformationfrommultipledatabasebyissuing queriesagainstremotedatabaseserversacrossInter net.Delayeddatatransmissionsandlostdatapack agesoftendecreasetheirefficiency.Hence,aconsid erableamountofworkhasfocusedontheproblemof semanticcachingfortheseapplications[1-3],but mainlyfocusontherelationaldatabases.Asthenum berofwebapplicationsthatbackedbyXMLdatabase increases,sodoestheneedtoprovideefficient cachingmechanismssuitableforthenatureoftheex ten…  相似文献   

14.
15.
用XML实现CNSDTF的矢量数据交换格式   总被引:5,自引:0,他引:5  
利用可扩展标记语言XML实现了CNSDTF的矢量数据交换格式,生成了符合W3C标准的XSD Schema文档以及CNSDTF附录样本文档所对应的XML文档,给出了Schema文档的完整结构以及部分代表性元素的实现代码,并作出了相应的说明,利用该文档,以Altova的XMLSpy为辅助工具,生成了CNSDTF附录B中矢量数据交换格式样本的XML文档,生成的XML文档完全符合网络矢量数据传输的条件,该Schema文档可以作为对应所有XML数据文件的校验依据,并进一步成为书写,读写这些数据文件源代码的基础。  相似文献   

16.
为了提高大规模半结构化文档集的聚类质量,提出了一种新的XML文档聚类方法.从XML文档中提取层次路径序列,以此为依据将XML文档表示为VSM中的向量,将欧氏空间对应于粒子群模型的问题空间,采用粒子群聚类方法进行文档聚类.为了加速算法的收敛性,在算法的后续部分采用C-means进行快速局部调优,提出两阶段混合聚类方法,优点是能够跳出局部极值,搜寻整个问题空间的同时又保证了合理的时间.实验结果表明提出的方法具有较高的聚类准确性和较好的收敛程度.  相似文献   

17.
为将原始的岩画信息转换为国际化的可持续研究的数字资源,通过对原始资源的分析和对国际流通标准的借鉴,设计了基于DC的岩画中文元数据标准,实现了该标准的RDF/XML描述,并且根据岩画元数据的特点和XML文档的结构化提出信息在关系数据库中的存储方案.研究实现了基于DC标准的岩画图像信息的表示和存储,使岩画信息成为可精确查询的网络流通的信息资源.  相似文献   

18.
提出了基于框架构造可扩展标识语言(XML)的文档类型定义的方法. 框架可以作为信息和XML文档之间的中介. 通过将框架映射为XML文档中的元素,使得框架的结构性、逻辑性和推理机制与XML的简洁性、通用性和灵活性相结合,增强了XML的语义表达能力,有利于数据的共享和交换.  相似文献   

19.
可扩展标记语言正在成为Web上各种应用交换信息的标准。对高性能可扩展标记语言数据处理技术的需求正日益增长。现有的大部分可扩展标记语言文档相似度计算方法是基于文档结构特征的。该文提出了一个新的基于综合语义的可扩展标记语言文档相似度计算方法。该方法综合利用了可扩展标记语言文档的结构信息和内容信息,具有一定应用前景。  相似文献   

20.
半结构化描述语言XML的出现,提供了一个文档交换的格式接口,在此基础上介绍了一种易于扩展的基于中间层数据交换协议的文档格式转换处理机.并以一个WPS文档与Open Office文档转换的实例说明了此设计方法的高效性、安全性和可扩展性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号