首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 250 毫秒
1.
文中通过对关系模式中的属性进行适当的分类,讨论了一个属性成为主属性应该满足的条件,并在文献「4」、「5」「6」的基础上,采用闭包,实现了利用Armstrong公理进行函数信赖推导的过程,从而给出了一个简便的求解关系模式全部主属性的多项式时间算法。  相似文献   

2.
本文在模式矩阵理论研究的基础上,将关系模式对应的模式矩阵的全部极大同类块求出,变换,给出一个全部主属性求解的多项式时间算法。  相似文献   

3.
基于最大相关块的关系模式全部主属性的一种解法   总被引:1,自引:1,他引:0  
本文是把关系模式中的函依赖集进行划分,对应的属性集合构成一个相关块,再对每个相关块求其主属性,最终给出求全部主属性的多项式时间的一种算法。  相似文献   

4.
求关系模式全部候选关键字的算法   总被引:5,自引:1,他引:4  
本文利用对属性进行分类的方法研究了一个属性成为主属性应该满足的条件.着重讨论了当一个属性既出现于函数依赖的左部,又出现于函数依赖的右部时成为主属性的必要条件和充分条件.并在此基础上,提出了一个求关系模式全部候选关键字的有效、易行算法.  相似文献   

5.
通过分析关系模式的属性在函数依赖中所起的作用,发现在关系模式中的部分属性必定为主属性,而部分属性必定为非主属性,可以通过减少对属性的搜索次数,从而提高算法的效率,降低算法的时间复杂性。为此,本文提出一种切合实际的求解候选关键字的有效算法。  相似文献   

6.
基于矩阵的关系模式主属性判定算法的研究   总被引:2,自引:0,他引:2  
本文从分析主属性在关系模式中的特点出发,在模式矩阵及其分类的基础上,给出了一个基于矩阵的关系模式主属性的判定算法。  相似文献   

7.
周定康 《计算机学报》1995,18(10):770-776
本文定义了分类属性的六个函数和属性集弱闭包概念,开发了决定双元非主属性的算法;并从变换技术入手,导出了将一个关系模式映射成与之等码的简单关系模式的理论和方法。  相似文献   

8.
该文深入分析了主属性在关系模式中的结构特征,提出了化简独立复合环、独立简单环、化简双部属性函数依赖图等概念。在此基础上,给出了一个关系模式主属性判定的多项式算法。  相似文献   

9.
Pawlak粗糙集的知识约简包括对决策表的知识约简和对信息表的知识约简。作为Pawlak粗糙集的扩展,邻域粗糙集在针对决策表的属性约简方面应用广泛,而针对信息表的属性约简方面应用鲜少。为了设计一种适用于信息表的属性约简算法,根据Pawlak粗糙集的信息表知识约简标准,首先提出一种邻域粗糙集的信息表知识约简标准,然后根据这种标准,结合贪心思想,进一步提出了一种适用于聚类任务的信息表属性约简算法。与主成分分析(principal component analysis,PCA)算法相比,实验结果表明用该算法对数据集降维后,得到的属性约简集合的属性个数较多,K-means算法根据属性集合进行聚类的精度较高。实验结果证明该算法能有效地应用于信息表的属性约简方面。  相似文献   

10.
粗糙集理论是一种采用新方式来研究不精确、不确定性知识的数学工具。属性约简的计算是粗糙集理论中的一个重要问题。描述基于粗糙集的属性约简的相关概念,包括核、约简、分类精度;通过分析多种属性约简算法,结合可辨识矩阵和逻辑运算,提出了一种属性约简算法;围绕高校中的管理信息系统,利用该算法抽取与学生就业相关的数据信息,给出了影响学生就业的各条件因素与工作方向之问的依赖关系和约简后的数据表;获取相关规则得出结论,取得了良好的效果。  相似文献   

11.
12.
13.
基于改进区分矩阵的决策表增量式属性约简   总被引:2,自引:0,他引:2       下载免费PDF全文
针对属性在不断增加的决策表,为了快速准确地计算出属性约简,提出一种增量式属性约简算法。以正域为约简的标准,利用贪心算法思想,以属性区分能力为选择标准,逐渐构造近似的属性约简,从中删减掉不必要的属性,最终得到属性约简。经复杂度分析与实验数据测试,证明该算法的复杂度低并且约简结果准确。  相似文献   

14.
关系模式一种基于超图的全部候选关键字求法   总被引:1,自引:0,他引:1  
本文详细讨论了基于超图的关系模式的有关候选关键字的某些理论,给出了相应的定理.圆满地解决了关系模式全部候选关键字的求解问题,具体地给出了以递归形式的求全部候选关键字的新算法.  相似文献   

15.
余泽 《计算机系统应用》2014,23(12):125-130
混合属性聚类是近年来的研究热点,对于混合属性数据的聚类算法要求处理好数值属性以及分类属性,而现存许多算法没有很好得平衡两种属性,以至于得不到令人满意的聚类结果.针对混合属性,在此提出一种基于交集的聚类融合算法,算法单独用基于相对密度的算法处理数值属性,基于信息熵的算法处理分类属性,然后通过基于交集的融合算法融合两个聚类成员,最终得到聚类结果.算法在UCI数据集Zoo上进行验证,与现存k-prototypes与EM算法进行了比较,在聚类的正确率上都优于k-prototypes与EM算法,还讨论了融合算法中交集元素比的取值对算法结果的影响.  相似文献   

16.
Partitional clustering of categorical data is normally performed by using K-modes clustering algorithm, which works well for large datasets. Even though the design and implementation of K-modes algorithm is simple and efficient, it has the pitfall of randomly choosing the initial cluster centers for invoking every new execution that may lead to non-repeatable clustering results. This paper addresses the randomized center initialization problem of K-modes algorithm by proposing a cluster center initialization algorithm. The proposed algorithm performs multiple clustering of the data based on attribute values in different attributes and yields deterministic modes that are to be used as initial cluster centers. In the paper, we propose a new method for selecting the most relevant attributes, namely Prominent attributes, compare it with another existing method to find Significant attributes for unsupervised learning, and perform multiple clustering of data to find initial cluster centers. The proposed algorithm ensures fixed initial cluster centers and thus repeatable clustering results. The worst-case time complexity of the proposed algorithm is log-linear to the number of data objects. We evaluate the proposed algorithm on several categorical datasets and compared it against random initialization and two other initialization methods, and show that the proposed method performs better in terms of accuracy and time complexity. The initial cluster centers computed by the proposed approach are close to the actual cluster centers of the different data we tested, which leads to faster convergence of K-modes clustering algorithm in conjunction to better clustering results.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号