首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
相似性连接是很多研究问题的基础,不少实际问题也都可以归结为相似性连接。针对两个输入集合相同的相似性连接问题,以R*树作为索引结构,提出一种高效的自相似性连接算法Self-SJ,返回最相似的k个对象对。该算法利用了分支界限思想,在使用剪枝策略减少候选对象对的同时,也避免了重复节点对的计算,因而比传统的基于R*树的算法更加快速。在真实数据集上的实验表明,Self-SJ不仅具有更短的运行时间,对于参数k也具有良好的可扩展性。  相似文献   

2.
R*-树可有效地提高散乱点云、网格曲面等数据的处理效率.为提高R*-树结点空间利用率,将结点分裂过程视为多目标优化问题,采用遗传多目标优化求解结点分裂的近似全局最优解集;以结点最小外接矩形的重叠度和体积作为评价标准选取最佳分裂方案,实现R*-树的结点最优分裂.实例结果证明,该算法可实现各类复杂几何对象的R*-树结点分裂问题,并有效地降低R*-树结点分裂的参数依赖性,提高R*-树空间数据的查询效率.  相似文献   

3.
在分析了R树结点分裂方案存在不足的基础上,将分割聚类技术应用到R树结点分裂中,提出基于分割聚类技术的R树结点线性分裂算法(C-Linear),并对C-Linear分裂算法进行了理论分析和实验验证,结果表明该算法具有良好的性能,能有效地提高R树的操作效率.  相似文献   

4.
5.
概率XML文件是概率数据的网络数据交换和表示标准,元素取值及其概率的查询与计算是概率XML文件的重要研究内容.概率XML文件树是一种有效的概率XML文件的数据模型,定义了概率XML文件树的基本路径和扩展路径,提出了根据可能世界原理将概率XML文件树分解为普通子XML树的集合的算法,根据路径分析原理将概率XML文件树分解为子概率XML树的集合的算法和相应的查询与计算结点及结点集合概率的算法,并通过实验进行了比较分析.实验结果表明:这两种方法是有效的;与前一种方法比较,后一种方法适合较大的概率XML文件树、结点及结点集合的概率的查询,计算过程较简单.  相似文献   

6.
Andersson的删除AA-树结点的算法的主要思想是先删除结点再自下而上处理某些子树,涉及自下而上的后退。提出一种新的删除AA-树结点的算法,其主要思想是先自上而下处理某些子树再删除结点,不涉及自下而上的后退。举例说明新算法的执行过程。证明新算法是正确的。与Andersson的算法相比,新算法不涉及辅助栈的使用。设n是AA-树的内部结点的个数,执行新算法时进行O(lbn)次旋转,新算法的时间复杂性是O(lbn),与Andersson的算法的时间复杂性相同。实验结果表明新算法的平均执行时间比Andersson的算法的平均执行时间短。新算法的空间复杂性是O(1),比Andersson的算法的空间复杂性低。  相似文献   

7.
对于空间查询来说,目标近似是一个非常重要的问题.在R树中常用的是最小包围矩形(MBR),但是它的近似精度不是很高,因此用直角多边形来近似空间对象可以提高近似的精度.文中主要探讨了结点是直角多边形近似的R树的结点分裂算法.  相似文献   

8.
近似查询中重叠区域的扫描计算   总被引:1,自引:0,他引:1       下载免费PDF全文
根据R*树节点硬盘主引导记录(MBR)特征,在不改变最小外包矩形特征的前提下,通过区域扫描对正交MBR重叠区域边界建立二叉线段树,以此为基础分别计算面积和周长,有效改善了R*树节点结构。理论分析和实验均表明,与未经过重叠区域计算的R*树相比,经计算的R*树节点比较次数平均下降了近60%,准确率提高了约60%。  相似文献   

9.
吴钦阳 《计算机应用》2010,30(2):419-422
R*-树基于局部调整的思想对节点进行管理,存在时间与效率上的不足。为克服R*-树的不足,给出了一种新型的存储结构,并给出新型存储结构的插入、溢出、分裂等空间索引常用操作的算法。分析新的存储结构的优点,并通过实验结果说明该方案比R*-树具有更高的效率。  相似文献   

10.
为了提高检索速度,在分析R-Tree及R*-Tree的基础上,提出一种强制重插算法,通过改进R*-Tree多维空间索引结构加速搜索过程。实验结果表明,相比传统算法,该算法在索引空间利用率、动态创建索引、索引检索方面具有更高性能。  相似文献   

11.
由于道路交通矛盾的现象已经日益严重,利用智能交通系统解决交通问题已成为普遍共识.文章重点讨论了地理信息系统技术和全球定位系统技术等相关技术,并利用改进的R树索引完成了智能交通系统的核心不确定范围查询算法,分析与实现了智能交通系统.  相似文献   

12.
给出一种无线传感器网络中无锚节点情况下的节点间相互协同定位的算法。它首先将节点进行分簇,把角度测量和距离测量结合起来,通过方位协同,逐步对同步中的节点进行方位调整和坐标调整,从而计算出所有节点的相对坐标。仿真结果表明,在节点随机分布的情况下,该算法比起业界公认的聚类SPA算法在网络覆盖率、定位误差率和通信开销3个方面都有更好的表现。  相似文献   

13.
为了解决Web数据库多查询结果问题,提出了一种基于改进决策树算法的Web数据库查询结果自动分类方法.该方法在离线阶段分析系统中所有用户的查询历史并聚合语义上相似的查询,根据聚合的查询将原始数据划分成多个元组聚类,每个元组聚类对应一种类型的用户偏好.当查询到来时,基于离线阶段划分的元组聚类,利用改进的决策树算法在查询结果集上自动构建一个带标签的分层分类树,使得用户能够通过检查标签的方式快速选择和定位其所需信息.实验结果表明,提出的分类方法具有较低的搜索代价和较好的分类效果,能够有效地满足不同类型用户的个性化查询需求.  相似文献   

14.
提出用重叠度来刻画模糊类间的距离,在此基础上针对模糊划分总重叠度有随类数增加而单调递增的趋势,提出基于重叠度增量的聚类有效性函数。该算法由重叠度增量最大值来确定最佳聚类数,不但克服了传统有效性函数的单调问题,而且计算简单。基于模糊C-均值聚类算法(FCM),应用多组测试数据对其进行性能分析,并与当前广泛应用且具代表性的有效性函数进行深入比较。仿真结果表明,该函数的有效性和优越性。  相似文献   

15.
随着互联网的普及和网页数量的飞速增长,搜索引擎已经成为从网上获取信息的首选工具.然而,目前主流的搜索引擎在响应用户提交的检索请求时,往往以较长的一维列表形式分页展示结果,为了找到自己所需要的信息,用户必须对该结果列表进行耐心的浏览.为了进一步提高用户获取信息的效率和质量,减轻用户的劳动强度,研究者提出了对检索结果进行再挖掘、再组织的问题,聚类就是其中的研究热点之一.本文在分析现有检索结果聚类算法存在的问题的基础上,提出了基于查询相关性分析的标签驱动聚类算法,该算法通过分析短语与查询项的关联程度,提取作为候选簇标签的短语,然后根据这些标签确定网页摘要隶属的候选簇,最后基于对候选簇和标签的评价进行簇筛选和归并,得到聚类结果及每个簇的标签.在相同环境下进行的对比实验表明,所提出的算法优于相关工作,而且需要更少的信息资源支持.  相似文献   

16.
基于信息熵的二元分割算法离散连续属性,在对连续属性较多,数据量较大的数据集进行分析预测中,存在不足。实验表明,在决策树算法中结合改进后的k-means算法作为连续属性离散化算法,在连续属性较多的数据实例中可以构造出更好的决策树。  相似文献   

17.
针对经典的K-means算法在多维数据聚类效率上还有待提高的问题,本文提出一种称为CK-means的改进聚类算法。该算法在k-means算法的基础上,通过引入Kd树空间数据结构,初始聚类中心从多维数据某一维的区间等间隔集中选取,以及在数据对象分配过程中采用剪枝策略来提高算法的运行效率。实验结果表明,CK-means聚类算法较经典的k-means聚类算法运行效率更高。  相似文献   

18.
在决策表中,决策规则的可信度和对象覆盖度是衡量决策能力的重要指标。以知识粗糙熵为基础,提出决策熵的概念,并定义其属性重要性;然后以条件属性子集的决策熵来度量其对决策分类的重要性,自顶向下递归构造决策树;最后遍历决策树,简化所获得的决策规则。该方法的优点在于构造决策树及提取规则前不进行属性约简,计算直观,时间复杂度较低。实例分析的结果表明,该方法能获得更为简化有效的决策规则。  相似文献   

19.
模糊聚类算法是一种有效的聚类手段,介绍了最大树模糊聚类算法。在商务网站中,以Web日志中数据为依据,基于访问模式对商品及用户进行模糊聚类处理,给出算法实现的步骤,讨论了实现的关键技术,并介绍了未来工作的发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号