共查询到12条相似文献,搜索用时 46 毫秒
1.
2.
提出了基于两阶段查询重写的XML近似查询算法.该算法不仅能够返回精确查询结果,而且能够返回带有相似度分值的近似结果序列.首先,通过模式重写策略,将原始查询树改写为多种XML DTD(文档类型定义)下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题,接着,利用基本变异操作得到的变异查询树对XML数据树完成精确嵌入,可将XML近似查询的问题转变为多棵变异查询树的精确查询问题,并给出了基于XML数据统计的相似度计算模型和Top-K问题求解的优化算法.最后,在汽车外形智能化设计的实验中表明该算法优于SSO算法. 相似文献
3.
唐鹏飞 《智能计算机与应用》2021,11(10):20-25
集值决策表拓展了经典决策表,但其现有属性约简算法中属性重要度度量方式单一.针对集值决策表,采用近似条件熵提出属性约简及其启发式约简算法.将近似精度与条件信息熵进行信息融合,定义近似条件熵,证明粒化单调性等性质;提出基于近似条件熵的属性约简,设计启发式约简算法;采用集值决策表实例与数据实验进行有效验证.实验结果表明:与现... 相似文献
4.
在DTD模型下,在XML信息树中引入了不完全信息,形成一棵不完全信息树。文中以不完全信息树为基础定义了树中节点之间的关系:节点值等价和节点值相容。并在此基础上定义了函数依赖的强保持条件、完全函数依赖弱保持。给出了给定函数依赖集判断完全函数依赖弱保持的算法及满足完全函数依赖弱保持时,当树确定化后成为完全信息树下函数依赖的可能性的证明。 相似文献
5.
6.
基于模糊粗糙集的知识获取方法在模糊粗糙集的研究中具有十分重要的作用,通过矩阵来刻画粗糙集理论,用模糊矩阵定义了模糊粗糙集和粗糙模糊集的上(下)近似、重要度等概念,给出模糊信息系统的属性约简算法,并用UCI数据集说明算法的可行性。 相似文献
7.
通过对XML结构聚类现状进行研究分析,提出了一种新的XML文档结构相似度度量方法DBTD(Density-Based of the Tree Distance),并在此基础上提出以基于密度的DBSCAN方法对XML文档进行结构聚类.实验表明:该方法能够对XML文档进行结构聚类,且其聚类结果充分展现了该方法的有效性. 相似文献
8.
9.
基于XML的数据在数据库中的存取技术 总被引:1,自引:0,他引:1
近年来,基于XML的数据交换与存取技术成为数据存取和交换领域的一项重要课题。XML不仅作为一种互联网上数据表示和交换的标准,而且被应用于电子商务、搜索引擎、电子数据交换等很多方面,因此受到了广泛的关注。文章将此技术展开分析,探讨了XML数据存取机制,分析了XML在数据库中的存储模式和应用模式,并结合Oracle8i给出应用举例。 相似文献
10.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高. 相似文献
11.
K?medoids算法具有对初始聚类中心敏感,聚类准确度不高及时间复杂度大的缺点。基于此,文中提出一种优化的K?medoids算法;该算法在已有的粒计算初始化基础上进行了改进,以对象之间的相似性作为判断依据,结合最大最小法初始化聚类中心,能有效地获取最佳或近似最佳的聚类中心;在优化的粒计算前提下,提出了基于微粒子动态搜索策略,以初始中心点作为基点,粒子内所有对象到其中心的平均距离为半径,形成一个微粒子;在微粒子内部,采用离中心点先近后远的原则进行搜索,能有效地缩小搜索范围,提高聚类准确率。实验结果表明:在UCI多个标准数据集中测试,且与其他改进的K?medoids算法比较分析,该算法在有效缩短收敛时间的同时保证了算法聚类准确率。 相似文献