首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
为探讨数据关联问题,对数据集实施分层粒化处理,得到分层结构的粒化树.进而利用粒化树的层次信息和粒度的数值表示,并通过关联数据产生的数据联系,给出两棵粒化树之间数据关联的定义.文中视上近似为算子,借助上近似运算对应的粒,获得数据关联的判定定理,并基于粒度的数值信息判定关联紧密程度,形成数据关联的粒化树描述方法,其展示的粒化分层和粒度数值表示可看作粒计算研究的一种形式.实例的讨论表明粒化树方法的应用价值  相似文献   

2.
闫林  高伟  闫硕 《计算机科学》2017,44(9):261-265, 299
为了研究数据合并问题,并使合并数据保持合并前的数据之间的关联关系,对各类数据信息给予了结构化的表示,对应产生了由数据集和加权关系组合构成的加权关联结构;进而通过数据集的合并粒化集,完成了加权关联结构向加权粒化结构的转换,使数据集中的数据依据粒化信息得到了合并,并保持或汇集了合并前的数据之间的关联信息,由此形成了数据合并的结构粒化方法。在此基础上,构建了加权关联矩阵和加权粒化矩阵,分别作为加权关联结构和加权粒化结构的矩阵表示。经中间变换和目标变换的矩阵计算,实现了加权关联矩阵向加权粒化矩阵的变换,产生了与结构粒化等价的矩阵变换方法,形成了程序设计的算法基础。  相似文献   

3.
粒化是粗糙熵阈值化算法的重要步骤,针对图像预处理的粒化方式不同,采用一种基于简单线性迭代聚类(SLIC)超像素的粒化方式.利用SLIC超像素算法的亮度相似性和空间相邻性将像素分为信息粒,在该粒度下构造了图像目标和背景的上下近似集及其粗糙不确定度.在此研究基础上,设计了粗糙熵阈值化分割算法.实验定性和定量地比较了本文算法...  相似文献   

4.
基于粒计算的决策树并行算法的应用   总被引:1,自引:0,他引:1  
针对传统的决策树分类算法不能有效解决海量数据挖掘的问题,结合并行处理模型M apReduce ,研究基于粒计算的ID3决策树分类的并行化处理方法。基于信息粒的二进制表示来构建属性的二进制信息粒向量,给出数据集的二进制信息粒关联矩阵表示;基于二进制信息粒关联矩阵,提出属性的信息增益的计算方法,设计基于M apReduce的粒计算决策树并行分类算法。通过使用标准数据集和实际气象领域的雷电真实数据集进行测试,验证了该算法的有效性。  相似文献   

5.
如何有效评价训练数据集的可用性,一直是困扰智能分类系统应用的难点问题。针对机器学习领域的数据分类问题,提出了一种基于区间分析和信息粒化的数据集分类可用性的评估方法,用于评价数据集的可分程度。该方法将待评估的数据集定义为分类信息系统,提出了分类置信区间的概念,通过区间分析进行信息粒化。在此信息粒化策略下,定义分类可用性的数学模型,并进一步给出单个属性以及整体数据集的分类可用性的计算方法。选择18个UCI标准数据集作为评估对象,给出了部分数据集分类可用性的评估结果,并且选取3种分类器对所选数据集进行分类实验,最终通过对上述实验结果的分析证明了该评估方法的有效性和可行性。  相似文献   

6.
闫林  宋金朋 《计算机科学》2014,41(3):258-262
通过对数据集的不同划分,得到了基于数据集的粒化树。结合关联元素的信息,建立了基于不同数据集粒化树之间的关联关系,确定了两种粒化树中的两条关联链,促成了它们经关联元素的相互联系。由于每一关联链中的粒从粗到细逐步变化,使得关联元素与粒度的逐步细化密切相关,这是粒计算数据处理模式的体现。相关的结论为人才供求问题的算法描述提供了数学模型,并通过实例予以展示。  相似文献   

7.
集值信息系统中的对象的属性值多值化,可以实现对复杂信息更全面的刻画.在传统的集值信息系统中,每个属性只有一个尺度.但在具体应用中,人们往往需要在不同的尺度上处理和分析数据.为此,将多尺度信息系统的粒度转换函数引入集值信息系统中,建立多尺度集值信息系统的理论框架,并讨论该系统的不同尺度间信息粒、粗糙集的关系.在此基础上,...  相似文献   

8.
基于粒计算视角,提出粒化-融合框架下的海量高维数据特征选择算法.运用BLB(Bag of Little Bootstrap)的思想,首先将原始海量数据集粒化为小规模数据子集(粒),然后在每个粒上构建多个自助子集的套索模型,实现粒特征选择,最后,各粒特征选择结果按权重融合、排序,得到原始数据集的有序特征选择结果.人工数据集和真实数据集上的实验表明文中算法对海量高维数据集进行特征选择的可行性和有效性.  相似文献   

9.
针对类簇交叉且分布不均衡的复杂数据,依据可信粒度准则,提出一种结合区间二型模糊粗糙C均值(IT2FRCM)聚类与混合度量的两阶段信息粒化算法。在第一阶段,利用IT2FRCM算法对原始数据进行聚类分析,得到初始的信息粒。在第二阶段,综合考虑数据空间分布、样本规模及粒子性质等因素,采用混合度量方法设计均衡证据合理性和语义独特性的粒化函数,并基于可信粒度准则优化由覆盖度和独特性组成的复合函数,求解最佳粒子边界。在人工数据集和UCI数据集上的实验结果表明,该算法能够有效提高不平衡数据的信息粒化质量和粒子代表性,在归类正确数、粒子特性等指标上均取得了理想表现。  相似文献   

10.
唐鹏飞  张贤勇  莫智文 《计算机应用研究》2021,38(11):3300-3303,3309
区间集决策信息表拓展了经典决策信息表,但其属性约简研究较少.针对区间集决策信息表存在的问题,采用模型正域及相关依赖度提出属性约简及其启发式约简算法.在区间集粗糙集模型中,定义关于决策分类的正域与依赖度,证明粒化单调性等性质.提出基于依赖度的属性约简,设计启发式约简算法.实例分析与数据实验表明,设计的基于依赖度的启发式约简算法是有效的,所得结果有利于依赖学习与特征优化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号