共查询到17条相似文献,搜索用时 62 毫秒
1.
基于信息表的求核算法存在如下不足:需要完整求出U/R后方可求核.为此,先寻求理论依据,说明U/R与U/(R-{a})的内在关系,得出了[x]R-{a}/{a}细分[x]R-{a}的结论,证明了U/(R-{a})≠U/R与"U/R元素有兄弟"的等价性.然后基于二叉树设计思想,用兄弟存储结构设计了一个新的信息表求核算法,仅需生成较小的二叉树就能求核,时间复杂度和空间复杂度分别为O(|C|2|U|)和O(|U|).算法的主要贡献是将求核问题转化为等价类生成过程中兄弟的有无判断问题.通过实例验证了算法的有效性. 相似文献
2.
关于求核的算法有很多,本研究利用选择排序的思想设计了求解等价类的算法,其时间复杂度为O(|C||U|)。在此基础上,设计的求核算法,算法时间复杂度为O(|C|^(2)|U|)。通过实验,证明了算法的正确性和高效性。 相似文献
3.
求核是粗糙集中一个重要的研究内容之一。本文对杨明的基于差别矩阵求核方法进行研究,实例表明其方法还存在一些不完善。为了能够进一步提高求核效率,对差别矩阵进行改进,提出一种简化差别矩阵的定义,并给出求核方法,同时证明了由该方法获得的核与正区域的核是等价的,由此设计求核算法,其时间复杂度为max{O(|C||U|),O(|C||U/C||U′1|)},空间复杂度为O(|C||U/C||U′1|)。实验表明,该算法是有效的、高效的,且能适合大数据集的处理。 相似文献
4.
基数估计是实现数据库多表连接(JOIN)查询优化的重要手段之一。对数据量较大的数据表进行基数估计时常用数据抽样来获得较小的样本,从而估计各种查询负载下所需的数据基数。在单表上利用数据抽样来完成基数估计的方法已经得到广泛研究,但在多个数据表的抽样样本总体存储预算存在限制时,目前仍缺乏有效的多表间样本数划分方法使得整体基数估计达到较优。为此,提出一种面向多表JOIN查询优化的基数估计方法,针对一组给定的含有复杂多JOIN操作的查询负载,为其合理分配数据库中每个表的抽样率,从而在满足样本大小总和限制的同时使得基数估计准确率达到最高。将上述过程抽象为一个抽样率分配搜索问题,在数据库数据抽样问题中引入贝叶斯优化搜索算法,利用该算法快速搜索出不同表之间抽样样本大小的分配比例,使得有限时间内获得的样本分配方案对应的基数估计准确率最高,从而达到查询优化的目的。在TPC-H数据集上的实验结果表明,在相同时间内确定多JOIN操作查询负载下基数估计准确率最高的抽样比例方案时,相比随机搜索算法,贝叶斯优化算法所得方案对应的基数估计误差率降低54.8%~60.2%。 相似文献
5.
基于二进制的知识表求核算法 总被引:3,自引:0,他引:3
求核运算是属性约简的基础,直接影响着知识约简的效率.提出了基于二进制的新的知识表求核算法,将求核运算转化为数值的比较运算,并且利用rough set理论的相关知识得出了一个重要定理,利用此定理,在求必要属性时,只需选取U/IND(R)每个分类中的一个元素进行比较,大大减少了数据处理量.与传统算法相比,其速度更快,效率更高,易于计算机实现,为扩展粗糙集的应用提供了理论基础. 相似文献
6.
目前,求核算法存在以下不足:求得的核与正区域的核不一致,求核算法的时间复杂度和空间复杂度不理想。针对上述问题,给出一种二进制可分辨矩阵的定义及其求核性质,并证明了由该性质获得的核与正区域的核是等价的,然后设计求核算法,该算法的时间复杂度为max{O(|C||U/C|2),O(|C||U|)},空间复杂度为O(|C||U/C|2)。最后实例说明该方法的可行性和有效性。 相似文献
7.
基于可分辨矩阵的快速求核算法 总被引:3,自引:0,他引:3
目前求核算法存在以下不足:求得的核与基于正区域的核不一致,算法的时间和空间复杂度不理想.针对上述问题,提出一种简化的可分辨矩阵的定义和求核方法,并证明了由该方法获得的核与基于正区域的核是等价的.为了提高算法效率,采用分布计数的基数排序思想设计等价类U/C划分算法,其时间复杂度为O(|C||U|).在此基础上,给出快速求核算法,其时间和空间复杂度分别降为max{O(|C||U/C|2),O(|C||U|)}和O(|C||U/C|2).最后,实例说明了算法的有效性. 相似文献
8.
9.
针对有序信息表的排序问题,提出了总体排序的过程框架。将有序信息表转化为二进制信息表,运用粗糙集理论对信息表进行简化,在对属性值标准化的基础上构造有序信息表中实体的排序度量函数,根据度量函数值的大小进行排序。实例表明该过程框架在误差允许范围内是有效可行的。 相似文献
10.
Pawlak粗糙集的知识约简包括对决策表的知识约简和对信息表的知识约简。作为Pawlak粗糙集的扩展,邻域粗糙集在针对决策表的属性约简方面应用广泛,而针对信息表的属性约简方面应用鲜少。为了设计一种适用于信息表的属性约简算法,根据Pawlak粗糙集的信息表知识约简标准,首先提出一种邻域粗糙集的信息表知识约简标准,然后根据这种标准,结合贪心思想,进一步提出了一种适用于聚类任务的信息表属性约简算法。与主成分分析(principal component analysis,PCA)算法相比,实验结果表明用该算法对数据集降维后,得到的属性约简集合的属性个数较多,K-means算法根据属性集合进行聚类的精度较高。实验结果证明该算法能有效地应用于信息表的属性约简方面。 相似文献
11.
官礼和 《计算机工程与应用》2007,43(17):164-166
针对决策表核属性的计算问题,首先对前人的一些结论观点进行了讨论,在认识这些理论观点缺陷的基础上,给出了分明矩阵的一个新的表示定义,并由此提出了一种新的核属性计算方法。然后依据论域中各对象在某个条件属性上的不同取值把决策表信息系统划分为多个子决策表信息系统,给出了几条相关性质以及子决策表与原决策表核属性的关系定理。最后提出了一种决策表核属性的分布式计算方法,实例分析表明该算法是有效的。 相似文献
12.
目前,基于不完备决策表的属性约简研究较少。基于信息量的不完备决策表属性约简是一种新的属性约简。由于在该属性约简中,计算相容关系是最主要的计算,也比计算等价关系要难得多。基于信息量的不完备决策表的属性约简算法的时间复杂度一般为O(|C|2|U|2)。为降低其时间复杂度,首先分析了老算法的不足,然后给出了一个效率较好的计算相容类的算法。最后设计了一个新的基于信息量的不完备决策表的属性约简算法,其时间复杂度为O(|C|2|U|2)。 相似文献
13.
14.
求核是粗糙集理论的重要研究内容之一,现有的求核算法大部分都是基于完备决策表的,对基于不完备决策表的求核研究很少。提出了不完备决策表二进制差别矩阵的构造方法,在此基础上,利用二进制差别矩阵设计了一种不完备决策表的求核算法。从理论上证明了基于二进制差别矩阵的求核与基于正区域的求核是相等的。新算法的时间复杂度是[O(|C||U|2)],用实例分析说明了新算法的正确性。 相似文献
15.
16.
在差别矩阵的基础上,针对不完备决策表提出了基于差别矩阵的区分对象对集定义,并证明求不完备决策表的核可以转化到求基于差别矩阵的区分对象对集上。在此基础上,提出了一种基于区分对象对的不完备决策表求核算法,该算法的时间复杂度为:[max{O(|C||U||Upos|),O(K|C||U|)}],优于同类算法的时间复杂度;用实例说明了新算法的有效性。 相似文献
17.
计算不完备决策表的核属性是粗糙集理论的重要内容之一。目前关于不完备决策表的求核算法的研究相对较少,而且在一般的求核算法中,其时间复杂度为[O(|C||U|2)]。为了有效地降低算法的时间复杂度,给出了一个不完备决策表的差别矩阵定义和基于差别矩阵的核定义,并证明了该定义与基于不完备决策表的核定义是等价的。在此基础上,利用差别矩阵方法来设计一种计算不完备决策表的求核算法,其时间复杂度降为[O(|C||Upos||U|)]。最后用仿真实例说明了新算法的有效性。 相似文献