首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 265 毫秒
1.
介绍了一种用于支持复杂XML数据查询优化的XML查询代数XQA以及用于实现XQuery语言的中间语言FXQL,进而提出了一种基于XQA代数的去除相关性方法(de-correlation),通过查询重写引入连接运算的方法,使得人们有可能更多地利用高性能的连接算法来提高查询效率.在扩展了广义表结构的XDM数据模型的基础上,这种查询重写通过FXQL语言的程序变换方法来实现,易于与各种函数式语言编译优化技术相互结合.实验结果证明了该方法的有效性.  相似文献   

2.
现有的XQuery处理策略有基于核心语法一次一结点的方法和基于代数的一次一集合2种,单独使用这2种方法都不能很好地解决XQuery查询处理和查询优化问题.该文提出了一个有效的XML代数系统-ETA.总结已有的XML代数的工作,分析新的XML查询问题,并在前述2种策略的思想的基础上提出了操作范围的概念.提出XML代数查询优化策略,主要包括选择谓词下移、抽取下移与分合、抽取替代自连接以及XML函数依赖及键约束等策略.ETA代数能够表达W3C的用例和XMark测试集的所有查询,查询效率得到提高.  相似文献   

3.
对于AI与数据库优化问题,现有技术均须改动数据库底层,影响研究成果的应用且缺乏可扩展性. 提出一种非嵌入数据库的学习式查询优化方法. 在基数估计阶段,使用多模型的方法,对特定的子查询建立神经网络,独立训练不同的子模型,解决需要训练集过多且可扩展性差的问题;在连接优化阶段,应用基于代价的强化学习方法,提高查询优化性能. 针对每个查询,从基数估计到连接排序的优化过程都在数据库外执行,按照得到的优化策略对查询重写,并将重写结果返回到数据库中,通过设置参数使该查询按照指定的计划执行. 在包含8个表的数据集上进行实验验证,与未进行优化的查询进行比较,非嵌入数据库的优化方法具有良好的优化效果.  相似文献   

4.
针对XML数据半结构化的特点及传统的tf-idf方法仅考虑关键字在文档中出现的频率和包含关键字的文档数,而未考虑XML文档中关键字语义信息的不足,提出了一种新的关键字权重度量方法。该方法充分考虑了XML文档中关键字所出现的路径、路径包含关键字的个数、包含路径的文档个数、路径的层次等影响关键字语义的因素,用于计算关键字权重,从而提高了关键字权重度量的准确性。在多个数据集上的实验结果表明,将该方法应用于XML文档的分类时,与传统的tf-idf方法和基于规则的方法相比,分类的查全率、查对率及F1均有所提高。  相似文献   

5.
XML检索中基于聚类的查询词扩展   总被引:1,自引:0,他引:1  
XML文档是一种半结构化的数据,它包含的结构信息可有效解决传统文本信息检索中存在的语言二义性等问题.但用户提出的查询质量低并没有得到解决,因此需要通过反馈等手段来解决这一问题.该文提出了一种基于聚类的XML信息检索的查询词扩展方法,利用聚类手段来确定用户查询的对应检索结果的特征,通过提取这些特征来进行查询词扩展,得到更全面的反映用户查询意图的查询条件,提高检索的查全率与查准率.  相似文献   

6.
目的提出一种XML文档存储和查询方法,解决XML文档有效的存储和查询,避免处理XML数据时进行多级复杂的转换.方法充分利用关系数据库成熟技术,有效实现大量数据的存储和查询.采用SAX技术解析XML文档,并通过对现有哈夫曼编码进行扩展,实现将XML文档结点信息和属性以关系结构进行存储和查询.利用扩展后的哈夫曼编码来存储结点信息和结点之间关系.结果通过遍历XML文档生成了XML文档对应扩展哈夫曼编码,实现了XML文档信息以关系数据形式存储和查询,并实现了SQL语句与XML查询语句的转换.结论基于扩展哈夫曼编码结点映射的存储与查询方法能较好地实现结点信息与结点关系的存储,并有效地实现查询,在应用中具有一定可行性.  相似文献   

7.
为高效地实现XML多分支路径查询,提出了基于索引的XML多分支路径查询算法depthjoin.首先对XML文档进行编码并创建索引,然后对查询树进行查询匹配.采用栈存储多分支路径中的单路径,对多分支结点采用索引信息判定其子结点是否具有共同的祖先结点或父结点.与现有的XML分支查询算法相比,算法depthjoin充分利用索引,不需要进行单路径的连接操作,实验表明其查询效率比现有的查询算法高.  相似文献   

8.
为了解决在多文档下插入节点或需要修改节点编码时查询效率比较低的问题,提出了一种有效的结构连接算法.在分析现有单文档下的XML结构连接算法基础上,对祖先/后裔与双亲/孩子结构查询进行改进,基于归并思想解决多文档下的结构连接,以适应在面向方面的XML Schema中定义的基于多文档的查询.改进后的结构连接算法可以进一步利用XML数据的特点、索引和织入文档信息减少连接扫描的代价,具有一定的合理性、有效性和实用性.  相似文献   

9.
提出了两种高预测效率、高泛化能力的数值计算方法,一种方法是小波神经网络(Wavelet NeuralNetwork,WNN)算法;另一种是基于小波尺度函数的WSK-SV(Wavelet Scaling Kernel-Support Vector)算法.WNN算法将小波函数与BP神经网络方法相结合,通过输入层、隐含层、输出层间的连接权重以及隐含层使用的激励函数构成了这种算法的关键技术;WSK-SV算法将小波的尺度函数与SV(Support Vector)方法相结合,使这种算法既保持了SVM(Support Vector Machine)的优点,又具有很好的泛化能力.上述两种算法都属于计算智能(Computational Intelligence,简称CI)方法并用于人机系统的性能预测.  相似文献   

10.
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号