排序方式: 共有37条查询结果,搜索用时 15 毫秒
1.
SuffIndex--一种基于后缀树的XML索引结构 总被引:5,自引:1,他引:5
针对形如∥element1/dement2/…/elementm0的查询,提出了一种基于后缀树(suffix tree)的XML索引结构SuffIndex.SuffIndex的构造通过只对OEM数据树遍历一次以及在SurfIndex中引入后缀链(SuffIink)的方法,从而达到较低的构造代价.SuffIndex中所有结点利用Hash表保存到其所有子结点的指针,最终使查询∥element1/element2/…/elementm的处理代价为O(m). 相似文献
2.
Web数据集成系统基于QC模型的物化视图选择 总被引:2,自引:0,他引:2
在Web数据集成系统中,物化视图能够有效地减少网络传输代价,提高系统的查询效率.如何选择查询进行物化,使得选中的查询满足集成层的空间限制,同时获取最大物化收益,成为集成系统中一个迫切需要解决的问题.传统方法没有考虑到海量XML查询之间的包含关系,其选择的物化视图中可能包含冗余的信息.针对上述问题,提出了①Web数据集成系统中海量查询集合的QC(query containment)模型,该模型能够捕捉查询之间最常见的包含关系;②基于QC模型的物化视图选择算法,算法考虑了物化视图选择相关的主要因素,包括查询提交的频率、空间代价、查询重写能力和查询结果的完备性,提出了查询位图的物化视图组织方式,从而获取更加合理的物化视图选择方案.实验结果证明了该方法的有效性. 相似文献
3.
在四坐标叶片型面检测基础上,提出基于激光点云数据的叶片型面三维重构方法。激光位移传感器对叶片型面进行多视角扫描采样,快速采集叶片型面海量点云数据。运用由点到线到面的数学建模原理,先基于端点一阶导矢连续法拟合出光顺NURBS曲线,再依据分片能量法构建辅助曲面拟合出光顺NURBS曲面,最后对分片NURBS曲面进行统一描述,构造出精确光滑的叶片型面,实现叶片型面的三维重构。实验结果表明:采用该方法实现对各类叶片复杂型面的三维重构,重构误差均<0.015 mm,能够满足精密零件的测量需求。 相似文献
4.
5.
Xpath成为XML数据查询的基本机制.Xpath中表达节点之间的祖孙关系的‘//'和任意匹配字符的‘*'等非确定操作符,增强了Xpath表达方式的灵活性,但同时引入了Xpath处理的复杂性.如何利用DTD减少Xpath中的不确定操作符,从而提高Xpath的执行效率成为一个基本的研究问题.传统方法主要侧重于特定受限Xpath的确定化重写.利用树自动机在一个框架中表达Xpath和DTD,提出了一种新的Xpath树自动机和DTD树自动机的乘积运算,并证明了乘积的结果就是基于DTD的Xpath优化形式,在多项式时间内基于代价获取了Xpath的优化结果.实验数据表明,基于提出的Xpath的逻辑优化方法,能够有效地提高Xpath执行器的执行效率. 相似文献
6.
特征选择在模式识别和数据挖掘等领域都有十分广泛的应用.然而,当涉及空间数据时,由于传统特征选择方法没有很好地考虑数据的空间特性,所以会导致特征选择结果性能下降.从空间数据本身的特性出发,提出一种特征选择方法MEFS(maximum entropy feature selection).MEFS在基于最大熵原理的基础上,运用互信息和Z-测试技术,采用两步方法进行空间特征选择.第1步,空间谓词选择;第2步,选择与每个空间谓词对应的相关属性集.最后,分别对MEFS方法和RELIEF方法以及基于MEFS的分类方法与决策树算法ID3分别进行了实验比较.实验结果表明,MEFS方法不仅可以节约特征提取和分类时间,而且也极大地提高了分类质量. 相似文献
7.
提出了基于移动均值的索引来解决子序列匹配中的\"ε-查询\"问题:提出并证明了基于移动均值的缩距定理和缩距比关系定理,后者具有很好的\"裁减\"能力,可以在相似查询时淘汰大部分不符合条件的候选时间序列,从而达到快速相似查找的目的;引入了由Jagadish等人提出的BATON~*-树,并在此基础上适当修改,建立了MABI索引,极大地加快了相似查询过程;最后,在一个股票交易数据集上进行了实验,证明了MABI索引的良好性能. 相似文献
8.
研究了数据流中频繁模式的挖掘问题,主要贡献在于:(1)基于启发式思想方法和抽样理论的基础上,提出了基于数据流样本集的分步模式估计方法;(2)算法求解所有长度的模式,而不仅仅是单项集模式;(3)为了找到满足精度要求的恰当的数据流样本集长度,引入了Hoeffding bound理论,并进行了修正,从而使之更适合于这一问题:(4) 提出了对估计模式进行在线维护的方法.基于上述方法的基础上,提出了模式估计和维护算法.最后,通过和已有算法进行实验对比分析,结果表明,该算法在结果精度、空间、时间复杂性等方面都适合进行数据流的分析. 相似文献
9.
在移动通信网络环境中,如何合理地组织和存储移动对象的配置信息,从而有效地降低查询和更新代价是位置管理中的一个重要问题.将数据挖掘应用到移动计算环境中是一项具有挑战性的研究课题,具有广阔的应用前景.区域划分能够优化位置数据库的拓扑结构,有效地降低查询和更新代价.但是随着时间的迁移,用户的移动模式会发生改变,导致原有区域的划分与当前的移动模式不符,因此产生了动态区域划分这一亟待解决的重要问题.聚类可以很好地解决区域划分问题,而对于动态区域划分问题,如果仍然采用聚类来解决,就等于重新划分,没有充分利用原有划分的信息,所需代价很大.提出了一种增量的聚类算法来解决动态区域划分问题.该方法以较小的代价调整原有划分,使得新得到的划分仍然满足区域划分所需满足的条件. 相似文献
10.
基于DOM的网页主题信息自动提取 总被引:43,自引:0,他引:43
Web页面所表达的主要信息通常隐藏在大量无关的结构和文字中,使用户不能迅速获取主题信息,限制了Web的可用性,信息提取有助于解决这一问题.基于DOM规范,针对HTML的半结构化特征和缺乏语义描述的不足,提出含有语义信息的STU-DOM树模型.将HTML文档转换为STU-DOM树,并对其进行基于结构的过滤和基于语义的剪枝,能够准确地提取出主题信息.方法不依赖于信息源,而且不改变源网页的结构和内容,是一种自动、可靠和通用的方法.具有可观的应用价值,可应用于PAD和手机上的web浏览以及信息检索系统. 相似文献