共查询到18条相似文献,搜索用时 46 毫秒
1.
一种新的基于有限自动机的XML过滤方法 总被引:1,自引:1,他引:0
设计实现了一种新的基于有限自动机的XML过滤方法,这种方法和以往基于有限自动机方法(不确定的有限自动机和确定的有限自动机)的不同在于它首先使用XML Schcma把带“*,//”的路径表达式简化,然后把生成的DFAs合并成一个大的DFA,这个DFA充当过滤引擎。 相似文献
2.
为了提高XML数据流的查询匹配效率,基于XML过滤技术研究提出了一种基于树自动机的XML过滤技术XTAFilter.该技术利用hash表来存储谓词,并对多个查询表达式XPath通过共享路径构建树自动机,减少了匹配的时间,提高了查询匹配的效率,同时降低系统运行时的活动状态.搭建仿真平台对技术进行验证,仿真实验结果表明,XTAFilter 技术能有效地提高XML数据流的匹配效率,提高了系统的实用性. 相似文献
3.
研究了基于自动机理论的XML查询重写问题,尤其针对局部查询重写技术作了深入研究.通过实例对其有效性进行了合理的分析. 相似文献
4.
基于索引的XML查询技术研究 总被引:2,自引:0,他引:2
介绍了目前XML数据查询技术的研究现状,对主要的XML索引查询技术作了较深入的探讨,其中包括:基于路径索引的XML查询方法,如DataGuide、1-index、A(k)索引等;基于编码的XML索引查询方法,如Anc_Desc_B^+、XR树+XR-Stack算法等。文中对相关XML索引查询方法的优点和不足进行了分析。 相似文献
5.
采用索引技术,对输入的XML文档建立一个双索引结构来改进YFilter算法,优化XML文档过滤性能。藉助索引结构,该算法超前搜索元素结点在文档中的结构信息,预先排除不能保证得到任何匹配结果的元素结点,以避免大量不必要的查询处理。实验结果显示,当输入的XML文档较大时,该算法有较好的过滤性能。 相似文献
6.
针对具有子孙轴(//)和谓词([])结构特征的XPath对具有不同递归深度的XML数据流进行递归查询处理问题,提出了基于下推自动机技术的处理方法,通过将XPath各类置步转化成相对应的处理模块,由算法将各类处理模块组合起来,建立了自上而下的树状查询模型.由于查询过程中将会发生多重匹配,从而会产生大量的匹配模式,该模型通过有效的匹配策略和缓存操作,对匹配模式进行保存及检验,成功地实现XML数据流递归查询.实验结果表明,该算法在性能上要优于传统方法. 相似文献
7.
基于自动机XML正则路径表达式查询研究 总被引:1,自引:0,他引:1
基于自动机正则路径表达式查询技术是半结构化数据模式下XML查询研究领域颇有价值的方法。许多研究方法对含有“//”操作符和“*”通配符复杂正则路径重写都会产生大量中间路径。设计了处理XML正则路径查询高效方法——CSAS,利用对象交换模型(OEM)作为XML数据模型,有限自动机作为查询模型,提出裁剪XMLSchema转化的自动机片断作为重写自动机来重写“//”和“*”符号的重写技术;利用剪枝技术、谓词处理后移策略实现查询优化。实验证明,CSAS方法是一种高效的XML正则路径表达式查询方法。 相似文献
8.
利用自动机高效处理XML路径表达式查询 总被引:1,自引:0,他引:1
在XML查询处理中,应用于绝大多数XML查询语言中的路径表达式在定位和查询XML数据和数据的结构关系方面具有极强的表达能力,并且由于XML数据的半结构化性,使得XML路径表达式查询的查询处理技术的研究与传统的数据库查询处理技术相比有着全新的特点和挑战.一些目前已有的查询处理技术可以用来处理路径表达式,但是查询处理中产生的大量中间结果导致了这些方法应用在大规模XML文档和复杂的路径表达式查询中时查询效率急剧下降.文中利用自动机技术设计了一个处理XML路径表达式查询的高效方法--SAM.SAM的基本思想是将路径表达式查询转化成一个与之完全等价的自动机,然后将其与从XML文档中抽象出来的模式路径相匹配.文中同时也给出了基于SAM方法的针对路径表达式中"//"操作符计算的有效解决方案.实验证明:SAM是一种非常有效的查询方法,在计算大数据量复杂路径表达式查询时具有非常高的效率,是一种实用的XML路径表达式查询方法. 相似文献
9.
10.
基于广义有限自动机的图像压缩方法 总被引:1,自引:0,他引:1
提出一种用确定性的广义有限自动机(GFA)对灰度图像进行压缩编码的方法.对一幅输入的数字化灰度图像,检测其中的自相似性,该图像可以被表示成一个广义有限自动机.解码算法可以非常高效的由确定的广义有限自动机复原图像,且结果图像没有很明显的方块效应.这种方法与传统的有限自动机方法相比具有状态数较少、压缩比高、压缩效果较好的优点. 相似文献
11.
XML自动机的构造及实用化研究 总被引:5,自引:0,他引:5
XML是目前已被广泛采用的WWW上信息交换和表示的技术之一,被称为Internet时代的通用数据格式。该文首先针对现有的XML语法进行了抽象及封闭性分析,得到了扩展XML语法,接着提出了一种XML自动机的概念,证明了它与扩展的XML语法等价,而且具有“并”、“交”、“差”和“补”运算下的完全封闭性,然后开发了一个分析器,对由此扩展语法生成的对象进行分析,最后阐明了XML自动机对于文中所建立的基于离散的XML模式数据库系统模式集成的意义。 相似文献
12.
13.
概率XML数据管理技术研究进展 总被引:2,自引:0,他引:2
随着网络应用的快速发展,XML数据已大量存在于当前的信息社会,使得XML类型的数据成为当前主流的数据形式,并已经成为Internet中进行数据交换和表示事实上的标准.由于客观世界的复杂性,不确定性是数据常见的内在属性,因此不确定的信息是普遍存在的.通常不确定信息以概率值的形式在XML文件(称为概率XML文件)中表示,因此,研究表示和处理概率XML数据将成为一个新的研究领域.自2001年以来,概率XML数据管理技术取得了一系列研究成果.从概率XML数据模型、PXML代数、查询、原型系统等几个方面综述了概率XML数据管理的研究进展,讨论了目前存在的主要问题和需要进一步研究的方向. 相似文献
14.
15.
16.
17.
多点触摸屏的应用程序开发是当前的研究热点.Linux multi-touch (MT)协议是Linux输入子系统的一个标准协议,定义了多点触摸设备驱动程序的数据传输规范,有着广泛的使用范围.识别和处理多点触摸屏驱动程序的数据是多点触摸屏应用最基本的功能.本文采用有穷自动机的思想,设计了一个可以识别符合Linux multi-touch协议规范数据的多点触摸屏中间件.中间件提供外部接口供应用程序使用,可以减少程序开发人员的重复工作,提高开发效率. 相似文献
18.
I. K. Rystsov 《Cybernetics and Systems Analysis》2004,40(4):467-477
The states of a finite automaton are ordered by height. This order is shown to be graduated, and the well-known Cerny problem on the minimal length of reset words can be formulated in terms of global height. The problem is proved for automata with four states. 相似文献