首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
为探讨数据关联问题,对数据集实施分层粒化处理,得到分层结构的粒化树.进而利用粒化树的层次信息和粒度的数值表示,并通过关联数据产生的数据联系,给出两棵粒化树之间数据关联的定义.文中视上近似为算子,借助上近似运算对应的粒,获得数据关联的判定定理,并基于粒度的数值信息判定关联紧密程度,形成数据关联的粒化树描述方法,其展示的粒化分层和粒度数值表示可看作粒计算研究的一种形式.实例的讨论表明粒化树方法的应用价值  相似文献   

2.
闫林  高伟  闫硕 《计算机科学》2017,44(9):261-265, 299
为了研究数据合并问题,并使合并数据保持合并前的数据之间的关联关系,对各类数据信息给予了结构化的表示,对应产生了由数据集和加权关系组合构成的加权关联结构;进而通过数据集的合并粒化集,完成了加权关联结构向加权粒化结构的转换,使数据集中的数据依据粒化信息得到了合并,并保持或汇集了合并前的数据之间的关联信息,由此形成了数据合并的结构粒化方法。在此基础上,构建了加权关联矩阵和加权粒化矩阵,分别作为加权关联结构和加权粒化结构的矩阵表示。经中间变换和目标变换的矩阵计算,实现了加权关联矩阵向加权粒化矩阵的变换,产生了与结构粒化等价的矩阵变换方法,形成了程序设计的算法基础。  相似文献   

3.
闫林  刘涛  闫硕  李峰  阮宁 《计算机应用》2015,35(2):358-363
为了研究实际中的数据合并问题,对各类数据信息给予了整体表示,使数据集、关联关系和划分共同组成了关联组合结构,为数据合并作了结构化的准备。进而,通过对关联关系的粒化处理,实现了关联组合结构到粒化结构的转换,促成了相关数据的按组合并。由于关联组合结构和粒化结构均与关联矩阵相互对应,所以基于结构转换的数据合并又可通过矩阵变换计算完成。因此所展开的讨论既包含了数据合并的理论分析,也给出了数据合并可程序化的数据形式,形成了以结构粒化为理论支撑、以矩阵变换为算法构成的数据合并方法。基于该方法的程序设计使数据合并实现了程序化,并保证了运行的线性复杂度。实验表明,理论支撑下的程序处理具有快速及准确的运行特性。  相似文献   

4.
闫林  宋金朋 《计算机科学》2014,41(3):258-262
通过对数据集的不同划分,得到了基于数据集的粒化树。结合关联元素的信息,建立了基于不同数据集粒化树之间的关联关系,确定了两种粒化树中的两条关联链,促成了它们经关联元素的相互联系。由于每一关联链中的粒从粗到细逐步变化,使得关联元素与粒度的逐步细化密切相关,这是粒计算数据处理模式的体现。相关的结论为人才供求问题的算法描述提供了数学模型,并通过实例予以展示。  相似文献   

5.
目前粒计算理论还没有公认的统一模型,为了解决这个问题,从粒集出发,定义了粒的个体对象间的泛化-例化关系、粒之间的泛包含关系,证明了它们都是偏序关系且具有偏序关系的粒集是一个范畴;定义了粒集的泛交运算,并通过实例给出了基于偏序关系的粒范畴的构造方法,讨论了这种粒范畴的几个性质。这些研究成果说明了基于偏序关系的粒范畴的构造方法是行之有效的,为研究粒范畴的应用问题奠定了基础。  相似文献   

6.
粒及粒计算在逻辑推理中的应用   总被引:26,自引:0,他引:26  
讨论了信息粒的结构及其实例。基于Rough集方法定义了决策规则粒,构造了决策规则粒库,它被用作逻辑推理。定义了粒语言,描述了这种语言的语法、语义、粒语句的运算法则和粒之相关的几个性质。定义了粒之间的相互包含(inclusion)和相似(closeness)。基于这些概念,构造了一种逻辑推理的新模型。这种推理模式的特点在于它既是逻辑的又是集合论的。所谓逻辑的就是说推理是遵循一种逻辑运算;所谓集合论的是指这种推理可利用对应于这种逻辑公式的意义集的运算进行推理,还用实例说明了这种推理模式是可行和有效的。  相似文献   

7.
卫婷  吴渝  李银国 《计算机应用》2007,27(9):2281-2283
针对粒计算算法在处理海量数据时所面临的内存限制问题,通过对信息表分层粒化模型的研究,提出了一种粒分布链表结构的概念,并利用该链表结构改进了一个粒计算算法。通过实验验证,改进后的算法能够直接处理海量数据集,同时不影响原算法的有效性。  相似文献   

8.
赵小龙  杨燕 《控制与决策》2019,34(10):2061-2072
增量式属性约简是针对动态型数据的一种重要的数据挖掘方法,目前已提出的增量式属性约简算法大多基于离散型数据构建,很少有对数值型数据进行相关的研究.鉴于此,提出一种数值型信息系统中对象不断增加的增量式属性约简算法.首先,在数值型信息系统中建立一种分层的邻域粒化计算方法,并基于该方法提出邻域粒化的增量式计算;然后,在邻域粒化增量式计算的基础上给出邻域粒化条件熵的增量式更新方法,并基于该更新机制提出对应的增量式属性约简算法;最后,通过实验分析表明所提出算法对于数值型数据的增量式属性约简具有更高的有效性和优越性.  相似文献   

9.
基于粒计算的Apriori算法及其在图书管理系统中的应用   总被引:2,自引:2,他引:2  
粒计算作为一种新的信息和知识处理的方法近来已经被许多研究者所重视,以及在许多领域中的得到应用。本质上,粒计算能够表示存储在系统中的数据的语义信息,因此粒计算能作为用于探索数据性质的一种方法,如挖掘数据库中的关联规则。本文在分析经典Apriori算法的基础上,从信息粒的角度出发,提出基于粒计算生成k-频繁项目集算法。分析了对给定问题,当用粒计算模型求解时需要解决的几个基本问题。最后通过实例说明如何通过信息粒的二进制表示,并基于粒计算k-频繁项目集生成算法来获取隐藏在图书借还记录中的有关关联规则。可以看出该算法具有实际应用价值。  相似文献   

10.
林洪  秦克云 《计算机科学》2018,45(10):47-50, 68
针对决策形式背景,文中研究了基于对象导出三支概念格的粒约简问题。首先提出了三支粒协调决策形式背景的概念以及三支粒协调集的概念,以此为基础给出了三支粒协调集的判定定理。然后结合区分矩阵和区分函数给出了三支粒约简方法,并通过实例说明了提出的约简方法的有效性。最后讨论了决策形式背景下三支粒约简、粒约简、分类约简之间的关系。  相似文献   

11.
现有的混合信息系统知识发现模型涵盖的数据类型大多为符号型、数值型条件属性及符号型决策属性,且大多数模型的关注点是属性约简或特征选择,针对规则提取的研究相对较少。针对涵盖更多数据类型的混合信息系统构建一个动态规则提取模型。首先修正了现有的属性值距离的计算公式,对错层型属性值的距离给出了一种定义形式,从而定义了一个新的混合距离。其次提出了针对数值型决策属性诱导决策类的3种方法。其后构造了广义邻域粗糙集模型,提出了动态粒度下的上下近似及规则提取算法,构建了基于邻域粒化的动态规则提取模型。该模型可用于具有以下特点的信息系统的规则提取: (1)条件属性集可包括单层符号型、错层符号型、数值型、区间型、集值型、未知型等; (2)决策属性集可包括符号型、数值型。利用UCI数据库中的数据集进行了对比实验,分类精度表明了规则提取算法的有效性。  相似文献   

12.
王蓉  刘遵仁  纪俊 《计算机科学》2018,45(7):197-201, 229
作为经典Pawlak粗糙集的扩展,邻域粗糙集能有效处理数值型的数据。但是,因为引入了邻域粒化的概念,所以邻域实数空间下的计算量要比经典离散空间下的计算量大得多。对于邻域粗糙集算法而言,能够有效且快速地找到数据集的属性约简是十分有意义的。为此,针对现有算法中属性重要度定义的不足,首先提出了一种改进的投票式属性重要度,然后进一步提出了一种基于投票式属性重要度的快速属性约简算法。实验证明,与现有算法相比,在保证分类精度的前提下,该算法能更快速地得到属性约简。  相似文献   

13.
现实世界中常常包含着海量的、不完整的、模糊及不精确的数据或对象,使得模糊信息粒化成为近年来研究趋势。利用论域上的模糊等价关系定义了模糊粒度世界的模糊知识粒度,给出了新的属性约简条件和核属性计算方法,以便更好地挖掘出潜在的、有利用价值的信息。针对粗糙集在对连续属性约简的过程中容易造成信息缺失和不能对模糊属性处理的现象,提出了一种基于模糊知识粒度对混合决策系统约简的启发式算法,省去了连续属性离散化过程,减少了计算量,为离散值域和混合值域约简提供了统一的方法。最后通过实例验证了其有效性。  相似文献   

14.
提出一种基于模糊理论的关联规则挖掘方法来处理数量属性,模糊理论能够实现数据的平滑过渡,使得挖掘出的关联规则具有高度的可理解性,给出了模糊关联规则的形式定义和挖掘算法.  相似文献   

15.
This article proposes a new axiomatic definition of entropy of interval-valued fuzzy sets (IVFSs) and discusses its relation with similarity measure. First, we propose an axiomatic definition of entropy for IVFS based on distance which is consistent with the axiomatic definition of entropy of a fuzzy set introduced by De Luca, Termini and Liu. Next, some formulae are derived to calculate this kind of entropy. Furthermore we investigate the relationship between entropy and similarity measure of IVFSs and prove that similarity measure can be transformed by entropy. Finally, a numerical example is given to show that the proposed entropy measures are more reasonable and reliable for representing the degree of fuzziness of an IVFS.  相似文献   

16.
鉴于已知的一些Vague集间的相似度量和距离公式有缺陷,提出用分段函数表达的Vague(值)集间的接近度的定义,应用此定义重新给出用分段函数表达的Vague(值)集相似度量的定义。给出了三个加权接近度公式和三个加权相似度量新公式。给出在Vague环境下用Vague集间的接近度和相似度量进行模式识别的方法。应用实例表明所给公式皆是有效的。  相似文献   

17.
Measures for uncertainty due to approximation of sets in rough set theory are accuracy and roughness. In determining these quantities, the cardinality of a set is always used and never the numerical values of the attributes (if they exist) of elements in the sets. Therefore, distances between the exact set and the corresponding upper and lower approximations can give a better quantitative measure of the roughness. Here, we propose a measure based on Hausdorff metric which takes into account the distance between two sets, the exact set and its two approximations (lower and upper). Using this measure, we can quantify the uncertainty of a rough set based on the values in the domain of sample points but not on the basis of number of sample points. Also, we propose a new measure for granulation which is again based on the Hausdorff metric. The effectiveness of the proposed measures is demonstrated on a synthetic data.  相似文献   

18.
姚晟  陈菊  徐风  汪杰  吴照玉 《测控技术》2019,38(3):16-20
多粒度粗糙集是一种重要的多粒度数据挖掘模型。为了对不完备信息系统中等价类重叠部分的定量信息进行挖掘,提出一种多阈值的量化容差关系程度多粒度粗糙集模型。首先将描述等价类重叠信息的程度多粒度粗糙集模型与处理不完备信息系统的量化容差关系进行结合,提出量化容差关系的程度多粒度粗糙集模型,然后在该模型的基础上,为每个粒度设定与数据相适应的阈值,提高了量化容差关系程度多粒度粗糙集模型的灵活性,增加多粒度数据挖掘的性能。UCI数据集的实验结果表明,本文所提出的粗糙集模型具有较好的分类效果和理论的可行性。  相似文献   

19.
目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但 还没有研究涉及 一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号