期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

针对XML流数据的复杂Twig Pattern查询处理 总被引：2，自引：0，他引：2

杨卫东王清明施伯乐《软件学报》2007,18(4):893-904

XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独的抽象语法树,因而能够以文档顺序、单遍地处理复杂Twig Pattern的匹配,并避免了YFilter中对嵌套谓词进行后置处理所产生的中间结果.实验结果表明,该方法能够有效改善Twig Pattern的处理性能,尤其是在处理大文档的情况下.基于已相似文献

2.

基于压缩策略的安全XML关键字查询

下载免费PDF全文

吴海涛唐振民《计算机工程与应用》2011,47(36):5-8

当含有敏感信息的XML文档在网络上传输或交换时,需要用户执行受限查询,如何提高查询效率,同时又保证敏感信息的安全一直是安全领域的研究热点。以带访问权限的实例信息树为主体,优先抽取主干信息策略,再反向作用于实例信息树存储特殊节点的压缩方法,为安全且高效的XML关键字查询奠定了基础,而且采用扩展的Dewey编码方式,为安全查询提供了方便。实验结果表明,这种基于压缩策略的安全查询方式减轻了存储负担,提高了查询效率。相似文献

3.

一种节点加权的相似重复XML数据检测算法

孙娜吴兰兰《计算机光盘软件与应用》2014,(2):99-100

XML类型的数据成为当前主流的数据形式,本文提出一种检测XML数据相似性的方法,即将XML文档转换成树结构的基础上,对树结构的节点加权,并结合树编辑距离算法。通过XML带权树各属性权值计算的相似度对数据进行粗略匹配与聚集,而在重新聚集的集合中使用树编辑距离算法更直接的进行相似性检测。由于XML数据集合范围的缩小,树编辑距离算法操作的次数减少,从而节省了一定的时间。相似文献

4.

一种基于层次栈的XML数据小枝查询算法研究

孙丹凤涂利明《计算机时代》2011,(6):34-36

当前针对小枝模式的XML查询是XML文档查询的研究热点。文章在分析XML数据小枝查询处理常用算法的基础上,提出了一种高灵活性的、易确定结点对之间结构关系的EDiezt-P编码,并基于EDiezt-P编码和层次栈结构提出了一种自底向上的小枝查询算法。实验表明,该算法在一定程度上减少了查询处理时间,提高了查询效率。相似文献

5.

XML正则路径表达式的优化技术研究

张慧敏张春玲孔鲁文《计算机系统应用》2008,17(5):36-38

为提高XML数据的查询效率,本文基于XML数据模型和路径表达式提出一种新的优化方法,方法通过定义及解析一种XML树节点的编码,消除正则路径表达式中的闭包运算和通配符,将正则路径表达式简化为简单路径表达式,确定节点的查询路径,最终改善了闭包运算和通配符的不确定性而引起的查询效率低下问题,并验证了方法的优化性能。相似文献

6.

XML数据流上基于关键字的多查询处理 总被引：2，自引：0，他引：2

周军锋孟小峰张新黄静《计算机研究与发展》2007,44(Z3):392-397

试图将基于XML文档的关键字查询技术引入数据流环境中,在同时处理大量基于关键字的查询的基础上为用户返回有意义的数据片段.提出了一种基于有向无环图的索引来高效组织大量基于关键字的查询,用以降低查询匹配的代价;针对数据流的特点,提出了一种基于栈的临时结果缓存方法,用于过滤大量查询无关的数据节点;通过实验从不同角度对提出的算法的各项性能指标进行了实验验证. 相似文献

7.

基于复杂模式索引的XML查询优化*

于红王秀坤高艳萍张建英杨南海《计算机应用研究》2007,24(8):100-105

分析了XML模式与XML文档之间的关系以及XML查询的特点,提出了一种基于复杂模式索引的XML查询优化方法.该方法对XML模式中的节点建立索引,查询时考虑XML模式中带有环的情况.首先对查询树进行去除重复元素的预处理,并将查询树分解成主路径和分支路径;然后利用索引查找潜在目标节点的XML模式编号;最后在XML文档中对对应节点进行筛选,找到目标节点.该方法可以减少连接操作的次数,提高查询操作的效率,能处理较复杂的XML模式. 相似文献

8.

面向对象XML数据的查询优化

董焕芝邱晓云陈利杰郝长胜《计算机时代》2007,(4):27-29

XML凭借自身所具有的自描述性、灵活的数据结构及丰富的数据表示能力等特性,正在成为Internet上数据表示和交换的标准,存储与查询XML数据变得日益重要;若要实现快速、准确、高效的查询,必须建立一定的索引来支持.文章为面向对象的XML数据建立了一种早期就能裁剪大量搜索空间的路径仓索引模式;基于该索引模式提出了一种新的查询方法,实现并优化了面向对象XML数据的查询. 相似文献

9.

XML数据库的索引技术研究

刘跃军罗颖《微计算机信息》2008,24(9):157-159

目前XML已经成为Internet以及电子商务中进行数据表示和数据交换事实上的标准.本文研究了XML的两种索引技术即结点记录类索引、结构摘要索引.深入分析了XML数据的区间编码技术,利用编码技术使孩子与双亲节点,兄弟节点可以通过编码值获取,降低节点对树型结构的依赖程度,使得查询在执行表达式时不必遍历整个结构树;同时引入基于后缀树的索引构造技术,尽可能地合并相同标签路径的节点.所以,周游一条路径即可得到该标签路径下的所有节点,避免了相同标签路径的重复访问的缺陷. 相似文献

10.

基于TF*IDF的垃圾邮件过滤特征选择改进算法*

陈琦伍朝辉姚芳宋秀荣张付志《计算机应用研究》2009,26(6):2165-2167

随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。相似文献

11.

基于XML索引技术的有效外延连接

姜学锋衡星辰覃征邵利平《计算机研究与发展》2008,45(6):1043-1055

首先给出了XML文档树、元素外延和名字路径等的形式化定义.接着,将编码方案、路径索引和名字外延的思想相结合,提出了一种改进的XML数据的索引结构(类型索引集、名字索引集和外延索引),解决了基于传统索引技术的XML数据查询方法性能上的不足.它既可以有效地支持结构连接的计算以快速地判断任意结点之间的子孙后代关系,也可以有效地支持基于名字外延的路径连接算法以快速地判断任意结点之间的父子关系,然后还可以快速地支持对包含拥有关系的小枝查询;进而给出了基于该索引结构的外延连接算法,并着重对其处理含有父子关系和拥有关系等较复杂的XPath查询路径的不同处理过程进行了对比和分析,使得对于一条长度为n的XPath绝对路径查询,最多只需要n/2-1次外延连接,且能够根据双亲结构信息等利用外延索引尽可能跳过不需要参与连接的结点.实验结果表明,提出的新的索引结构可以有效地提高查询处理的性能. 相似文献

12.

XML数据查询的并行算法

朱华兴周丽娟周梦熊《自动化技术与应用》2007,26(1):38-41

目前已经提出了多种查询XML数据的方法,然而这些传统的方法不能充分利用多处理器和多核心处理器的优势。本文提出了一种XML查询的并行算法,大幅提高了共享存储器多处理器、多核心处理器系统中XML数据的查询效率。相似文献

13.

XML数据流中的后兄弟查询算法

汪万根《计算机工程》2009,35(8):107-109

针对在XML文档树模型中进行后兄弟节点查询时内存消耗大、匹配效率低等缺陷,提出一种基于XML数据流与栈的后兄弟查询算法。采用SAX解析器与结构连接方法,对XML文档中所有已知节点与后兄弟节点进行精确匹配并输出。结果表明,该算法具有适用范围广、占用系统资源少、匹配效率高等优势。相似文献

14.

文献搜索引擎中特征项及权重的应用

李光敏《计算机系统应用》2014,23(5):188-191

针对目前用户在使用搜索引擎过程中,检索结果冗余、效率低下等问题,本文在对文献垂直搜索系统中Lucene.Net的索引算法研究基础上,结合用户实际专业检索需求,改变其算法中的激励因子,实验结果证明该方法确能提高搜索结果的相关度. 相似文献

15.

对基于本体的搜索中用户偏好库的算法研究

韩岳松李宝敏《微机发展》2007,17(12):64-67

介绍了本体的基本概念及其基本的元素。探讨了在基于本体的智能搜索中用户偏好库的作用和其类型,特别是客观世界中某一特定领域或主题的搜索中用户偏好库的研究。研究了用户偏好库中用户兴趣剖像生成的提取算法,即TF*IDF算法和TF*IWF*IWF算法和基于本体的查询扩展算法。并且讨论了各个算法之间的联系,论述了用户偏好库在基于本体的搜索系统中的独特作用。相似文献

16.

XML/GML非空间数据查询的结构连接算法

下载免费PDF全文

陈建华王华军苗放王卫红《计算机工程》2010,36(3):69-71,7

为利用Dewey前缀编码索引方案实现对XML/GML文档的编码并消除其缺点,提出一种扩展的Dewey编码方案——Ex-Dewey。在保留Dewey前缀编码优点的同时提出节点插入及删除对已有节点编码值串无影响的更新策略。针对Ex-Dewey编码方案提出一种在XML/GML非空间数据查询时快速确定候选节点间先辈-子孙、父-子关系的结构化连接算法——ED-XQ-SJ。给出算法思想、描述与验证。该算法无须访问实际存储的节点,算法复杂度较低且I/O开销减少。相似文献

17.

基于二次TF* IDF的互信息文本特征选择算法研究

王园龚尚福《计算机应用与软件》2011,28(4)

在分析传统互信息法缺陷的基础上,提出一种基于二次TF*IDF的互信息特征选择算法,对仅在一个类别中出现的特征词的重要程度给予再次的衡量,解决了互信息值相等而无法进行有效特征选择的问题。利用贝叶斯分类器对该方法进行验证的结果表明该算法在文本分类效率和正确率上比原有方法有一定的提高。相似文献

18.

一种基于.NET Services的标注系统框架 "MyAnnotation.NET"

谢波申瑞民王加俊《计算机工程》2003,29(16):179-181

“MyAnnotation.NET”是一种自动收集、管理、检索和共享个人信息的标准的开放的与操作系统和具体应用无关的通用标注框架（Annotation Framework)，它以．NET Serviccs的形式提供标准化、模块化的网络服务(Web Service)。该文介绍了它的体系架构、核心算法以及一个e-Lcaming领域的实施案例。相似文献

19.

DifX: 利用动态索引体系实现高效的XML数据查询

曲卫民张俊林孙乐孙玉芳《计算机研究与发展》2005,42(11):1997-2003

已有的XML数据索引方法从实现思想上可分为两类：结构归纳法和节点定位法.这两种方法都存在一定的问题,结构归纳法的缺点是索引规模较大而且难以有效支持较复杂的查询,而节点定位法的主要缺点是容易形成过多的连接操作.针对这些问题,提出了一种新的动态的XML索引体系DifX,它扩展了已有的动态索引方法,采用一种动态的Bisimilarity的概念,可以根据实际查询需求以及最优化的要求动态决定索引中保存的结构信息,以实现对各种形式的查询最有效的支持.实验结果证明DifX是一种有效而且高效的XML索引方法,其可以获得比已有的XML索引方法更高的查询执行效率. 相似文献