首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
属性约简是粗糙集核心内容之一,然而,传统基于邻域粗糙集的局部约简算法具有以下两个问题:1)经典邻域粗糙集没有关注到半径变化对样本标签的影响,以致于不同标签样本被划分到相同邻域;2)传统的属性约简算法只有一个约束条件,缺乏适用性.为了解决这一难题,论文从局部视角出发,利用伪标签邻域粗糙集模型,构建了一种属性约简方法.实验选取五组UCI数据集,通过多个算法的对比分析,论文所提算法提高了分类性能.  相似文献   

2.
姚晟  汪杰  徐风  陈菊 《计算机应用》2018,38(1):97-103
针对现有的属性约简算法不适合处理数值型属性和符号型属性共同存在的不完备数据,提出了一种拓展不完备邻域粗糙集模型。首先,通过考虑属性值的概率分布来定义缺失属性值之间的距离,可以度量具有混合属性的不完备数据;其次,定义了邻域混合熵来评价属性约简的质量,分析证明了相关的性质定理,并构造了一种基于邻域混合熵的不完备邻域粗糙集属性约简算法;最后从UCI数据集中选取了7组数据进行实验,并分别与基于依赖度的属性约简(ARD)、基于邻域条件熵的属性约简(ARCE)、基于邻域组合测度的属性约简(ARNCM)算法进行了比较。理论分析和实验结果表明,所提算法约简属性比ARD、ARCE、ARNCM分别减少了约1,7,0个,所提算法的分类精度比ARD、ARCE、ARNCM分别提高了约2.5,2.1,0.8个百分点。所提算法不仅能够获得较少的约简属性,同时具有较高的分类精度。  相似文献   

3.
罗帆  蒋瑜 《计算机应用研究》2024,41(4):1047-1051
针对现有邻域粗糙集模型中存在属性权重都相同,无法保证关键属性在属性约简时能够被保留的问题,提出了一种基于信息熵加权的属性约简算法。首先,采用了类间熵、类内熵策略,以最大化类间熵最小化类内熵为原则给属性赋予权重;其次,构造了基于加权邻域关系的加权邻域粗糙集模型;最后,基于依赖关系评估属性子集的重要性,从而实现属性约简。在基于UCI数据集上与其他三种属性约简算法进行对比实验,结果表明,该算法能够有效去除冗余,提高分类精度。  相似文献   

4.
邓大勇  李亚楠  黄厚宽 《自动化学报》2018,44(10):1781-1789
概念漂移探测是数据流挖掘具有挑战意义的研究难点,属性约简是粗糙集理论的研究核心.从概念漂移的角度研究了粗糙集理论的属性约简,从粗糙集属性约简的角度研究了概念漂移,将概念漂移和属性约简进行分析比较,指出了它们之间的区别和联系.提出了基于属性依赖度和条件熵的概念漂移探测准则,并将两种常用的概念漂移探测准则与属性依赖度、条件熵探测准则进行了比较.属性依赖度和条件熵兼具分类准确率的可实验检验和联合概率分布可进行理论分析的优点,还可以进行属性约简(或特征选择).实验结果显示,属性依赖度、条件熵和分类准确率都能有效地探测概念漂移,但是,与分类准确率相比,属性依赖度和条件熵在探测概念漂移时可以增加可重用性,减少工作量.属性约简和概念漂移之间关系的研究为属性约简、概念漂移的研究提供了新方法,为粗糙集、粒计算进一步融入大数据时代潮流提供了新思路.  相似文献   

5.
在粗糙集领域中,粒球的产生可以被视作是一个无监督的进程,其终止条件是无监督产生的粒球需达到根据标签信息所计算出来的纯度.当数据中存在大量不一致情形时,样本自身的标签信息有可能会为生成高纯度的粒球带来较大阻碍,基于粒球粗糙集的约简求解因受粒球生成这一因素的影响,也会耗时巨大.鉴于此,首先,将伪标签策略引入粒球的计算过程中,因为伪标签的生成也可以采用无监督的方式,所以可以较好地贴合粒球中样本的聚集,减少不一致情形,提高粒球的产生效率.其次,设计了前向贪心搜索算法,用于求解基于伪标签粒球粗糙集的约简.最后,在12组基准数据集上的实验结果验证了所提方法不仅能够有效地提升约简的求解效率,而且也能够保证约简中的属性具备相当的分类能力.  相似文献   

6.
姚晟  徐风  吴照玉  陈菊  汪杰  王维 《控制与决策》2019,34(2):353-361
属性约简是粗糙集理论一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法.针对目前邻域粗糙集模型中属性约简存在的缺陷,构造一种基于邻域粗糙集的邻域粗糙熵模型,并基于此给出邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等概念.邻域粗糙互信息熵是评估属性集相关性的一种重要的方法,具有非单调性变化的特性,对此,提出一种基于邻域粗糙互信息熵的非单调性属性约简算法.实验分析表明,所提出算法不仅比目前已有的单调性属性约简算法具有更优越的属性约简结果,而且具有更高的约简效率.  相似文献   

7.
基于近似决策熵的属性约简   总被引:3,自引:0,他引:3  
粗糙集理论已被证明是一种有效的属性约简方法. 目前有许多启发式属性约简算法已被提出, 其中基于信息熵的属性约简算法受到了广泛的关注. 为此, 针对现有的基于信息熵的属性约简算法问题, 定义一种新的信息熵模型—–近似决策熵, 并提出一种基于近似决策熵的属性约简(ADEAR) 算法. 通过在多个UCI 数据集上的实验表明, 与现有算法相比, ADEAR算法能够获得较小的约简和较高的分类精度, 具有相对较低的计算开销.  相似文献   

8.
针对通信辐射源个体识别技术中有标签信号样本不足导致个体识别准确率较低的问题,提出了基于伪标签半监督深度学习的辐射源个体识别方法,该方法利用加权平均思想改进了伪标签的赋值方式,有效增强了伪标签的质量,提升了网络模型的鲁棒性;介绍了如何基于伪标签思想设计半监督深度学习方法,并运用熵正则化算法的概念从理论方面解释了伪标签的有效性;实验设计了适合于信号样本的卷积神经网络,采取不同数目的有标签样本与无标签样本组建的训练集方案,得到了改进的伪标签半监督方法在测试集的识别准确率,结果表明,该方法较全监督方法和改进前的伪标签半监督方法有着更好的识别效果和更强的优越性.  相似文献   

9.
黄恒秋  曾玲  黎利辉 《控制与决策》2018,33(7):1207-1214
针对混合值不完备系统,提出一种基于双邻域粗糙集模型的分类方法.首先,定义一个新的不确定距离度量函数-----联系度距离函数,进而建立基于联系度距离函数的双邻域粗糙集模型;然后,基于所建立的模型讨论该模型的属性约简算法,并给出基于属性约简、覆盖约简的双邻域粗糙集规则学习分类算法;最后,通过多个UCI 数据集进行实证分析,结果表明所提出的分类算法是客观有效的,特别是在缺失值较多的情况下,其优势更加明显.  相似文献   

10.
目前粗糙集的研究局限于有限集,且现有的邻域粗糙集属性约简算法中属性重要性度量方式单一。针对邻域粗糙集存在的问题,提出了基于无限集的邻域近似条件熵模型。该模型以邻域近似条件熵下的属性重要度为启发条件,构造了一种基于邻域近似条件熵的前向贪心搜索属性约简算法。利用熵的单调性,证明了算法的正确性,并分析了算法的时间复杂度。通过实例分析和多个UCI数据集上的实验表明,所提出的算法是可行的,能有效减少属性数量,与现有的算法相比,不仅能够获得较小的属性约简结果,而且具有较好的分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号