首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于犹豫模糊熵的概念,提出了区间犹豫模糊熵和相似度的概念,同时研究了它们之间的相互关系。给出了区间犹豫模糊熵的公理化定义,在此基础上构造了两种形式的熵测度公式,并且证明了它们满足区间犹豫模糊熵的四条公理化准则;依据区间犹豫模糊熵引入了区间犹豫模糊加权熵的概念;提出了区间犹豫模糊相似度的概念,并且研究了区间犹豫模糊环境下的熵和相似度之间的关系。  相似文献   

2.
构造了新的区间犹豫模糊熵、交叉熵公式,提出了一种新的区间犹豫模糊多属性群决策方法,并将其应用于地方高等教育发展研究的过程中。构建了一种新的区间犹豫模糊熵公式,并证明其满足区间犹豫模糊熵的公理化条件;给出了区间犹豫模糊距离测度的公理性定义,研究了区间犹豫模糊距离测度和区间犹豫模糊熵、交叉熵的关系,并构建了区间犹豫模糊加权交叉熵公式。在区间犹豫模糊环境下,基于区间犹豫模糊熵、交叉熵以及交叉熵贴近度,提出了一种新的属性权重未知的多属性决策方法,并将其应用于对地方高等教育发展研究的过程中,验证该方法的可行性和有效性。  相似文献   

3.
张平  党选举  陈皓  杨文雷 《传感器与微系统》2011,30(11):135-137,141
针对目前相似重复记录检测方法不能有效处理大数据量的问题,提出一种基于熵的特征优选分组聚类的算法.该方法通过构造一个基于对象间相似度的熵度量,对原始数据集中各属性进行重要性评估,筛选出关键属性集,并依据关键属性将数据划分为不相交的小数据集,在各小数据集中用DBSCAN聚类算法进行相似重复记录的检测.理论分析和实验结果表明...  相似文献   

4.
针对不确定数据的概率分布难以获取的客观实际,讨论了缺失概率分布的值不确定离散对象的决策树。定义了(条件)概率区间,并证明了(条件)概率区间是可达概率区间;基于可达概率区间,定义了(条件)熵区间,并给出了求解(条件)熵区间的上/下界的方法;采用条件熵区间作为属性选择度量,提出了一种新的不确定决策树,将以0-1划分对象的决策树扩展到以概率区间分配对象的决策树,这样不仅可以处理缺失概率分布的值不确定离散对象,也可以处理确定离散对象。通过在基于UCI数据集的不确定数据集上的实验,证实了不确定决策树是有效的。  相似文献   

5.
直觉区间值模糊集的熵、距离测度和相似测度   总被引:2,自引:0,他引:2  
俞峰  杨成梧 《计算机科学》2008,35(6):199-201
熵、距离测度和相似测度是模糊集理论中的三个基本概念.本文中,我们给出了直觉区间值模糊集的熵、距离测度和相似测度的公理化定义并讨论了它们之间的基本关系.有别于以往的交、并运算,我们提出了直觉区间值模糊集的加法、乘法运算,并在此基础上讨论了直觉区间值模糊集的熵、距离测度和相似测度的性质.  相似文献   

6.
由于时间序列数据具有高维性等特征,不易直接进行挖掘.在对时间序列数据进行挖掘之前通常先进行特征表示达到降维的目的,分段聚合近似表示(PAA)是特征表示方法中比较常用的一种,针对PAA算法对每一区间有平均对待的缺点,提出一种采用小波熵的时间序列分段聚合近似表示,将小波熵运用到PAA算法的改进中,把某一区间内的小波能量熵值作为判评区间复杂度的指标,按各区间内小波熵值的比重分配各区间内分段数,实现对复杂区间详细描述,对相对平稳区间粗略逼近,利用matlab平台仿真证明,上述方法在压缩比相同的情况下比PAA方法更好地拟合原始序列,不仅能对时间序列有效地降维,而且能使近似更加精确,进而实现时间序列数据挖掘效率的提高.  相似文献   

7.
构建了区间犹豫模糊三角相似度公式,并且研究了区间犹豫模糊环境下属性权重信息完全未知的多属性群决策方法。首先基于正弦三角函数构造了区间犹豫模糊三角相似度公式,并证明其满足区间犹豫模糊相似度公理化定义的四个条件;接着给出了区间犹豫模糊交叉熵的公理性定义,同时研究了区间犹豫模糊相似度和区间犹豫模糊交叉熵的关系;最后基于区间犹豫模糊三角相似度,提出了在属性权重信息完全未知条件下的区间犹豫模糊多属性群决策方法,并用实例验证该方法的可行性和有效性。  相似文献   

8.
孙林  马天娇  薛占熬 《计算机应用》2023,(12):3779-3789
针对Fisher score未充分考虑特征与标记以及标记之间的相关性,以及一些邻域粗糙集模型容易忽略边界域中知识粒的不确定性,导致算法分类性能偏低等问题,提出一种基于Fisher score与模糊邻域熵的多标记特征选择算法(MLFSF)。首先,利用最大信息系数(MIC)衡量特征与标记之间的关联程度,构建特征与标记关系矩阵;基于修正余弦相似度定义标记关系矩阵,分析标记之间的相关性。其次,给出一种二阶策略获得多个二阶标记关系组,以此重新划分多标记论域;通过增强标记之间的强相关性和削弱标记之间的弱相关性得到每个特征的得分,进而改进Fisher score模型,对多标记数据进行预处理。再次,引入多标记分类间隔,定义自适应邻域半径和邻域类并构造了上、下近似集;在此基础上提出了多标记粗糙隶属度函数,将多标记邻域粗糙集映射到模糊集,基于多标记模糊邻域给出了上、下近似集以及多标记模糊邻域粗糙集模型,由此定义模糊邻域熵和多标记模糊邻域熵,有效度量边界域的不确定性。最后,设计基于二阶标记相关性的多标记Fisher score特征选择算法(MFSLC),从而构建MLFSF。在多标记K近邻(MLKNN)分类器...  相似文献   

9.
考虑到不完备信息系统中属性的相似关系和缺失值对系统不确定性的影响,如果仍然利用分块大小来衡量知识的信息量或粗糙性将变得不合理。本文在信息系统中定义了模糊测度系统信息熵、知识粗糙熵和粗集粗糙熵,证明了模糊测度粗糙熵的合理性及其性质,并举例说明如何选择合理的测度计算模糊测度粗糙熵,最后运用到知识的约简,为信息系统的约简提供了一种新的途径。  相似文献   

10.
陈桂兰  陈晓丹  曲天伟 《计算机仿真》2009,26(11):264-267,271
提出了一种图像熵和特征块匹配相结合的图像检索方法.为了提高图像的检索精度和效率,首先用计算图像熵并与设定的闭值比较实现对图像库的预分类;然后利用Harris算子检测出图像的特征点,用以特征点为中心的特征块的前三阶颜色矩来描述特征块的特征;进一步统计出两个图像中匹配的特征块数目,计算图像间的相似距离并进行仿真.仿真结果表明,算法中所使用的特征块更全面、更精确地描述了图像的视觉信息,实现相似度计算的方法简单和高效,证明分级检索方法在保证图像检索效率的前提下,极大地缩短了检索时间.  相似文献   

11.
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加。该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%。  相似文献   

12.
It is a significant and challenging task to detect the informative features to carry out explainable analysis for high dimensional data, especially for those with very small number of samples. Feature selection especially the unsupervised ones are the right way to deal with this challenge and realize the task. Therefore, two unsupervised spectral feature selection algorithms are proposed in this paper. They group features using advanced Self-Tuning spectral clustering algorithm based on local standard deviation, so as to detect the global optimal feature clusters as far as possible. Then two feature ranking techniques, including cosine-similarity-based feature ranking and entropy-based feature ranking, are proposed, so that the representative feature of each cluster can be detected to comprise the feature subset on which the explainable classification system will be built. The effectiveness of the proposed algorithms is tested on high dimensional benchmark omics datasets and compared to peer methods, and the statistical test are conducted to determine whether or not the proposed spectral feature selection algorithms are significantly different from those of the peer methods. The extensive experiments demonstrate the proposed unsupervised spectral feature selection algorithms outperform the peer ones in comparison, especially the one based on cosine similarity feature ranking technique. The statistical test results show that the entropy feature ranking based spectral feature selection algorithm performs best. The detected features demonstrate strong discriminative capabilities in downstream classifiers for omics data, such that the AI system built on them would be reliable and explainable. It is especially significant in building transparent and trustworthy medical diagnostic systems from an interpretable AI perspective.  相似文献   

13.
现如今生活当中的数据大多都是动态变化的,并且在数据动态增加的过程中,许多特征中包含有缺失数据。如何处理动态变化的含有缺失数据的数据集的特征选择成为一个亟需解决的问题。为此,基于粗糙集理论,通过更新互补信息熵在含有缺失数据的数据集维数增加时的更新机制,进而提出一种缺失数据维数增量式特征选择算法,并通过实验进一步验证了算法的可行性与高效性。  相似文献   

14.
目前已有蚁群算法优化的特征选择方法,大多采用的是以属性依赖度和信息熵属性重要度作为路径上启发搜索因子,但这类搜索方法在某些决策表中存在算法早熟或搜索到的特征子集包含了冗余特征,从而导致选择精度显著下降。针对此类问题,根据条件属性在分辨矩阵中的占比提出了一种属性重要度的度量方法,以分辨矩阵重要度作为路径上启发因子,设计了一种基于分辨矩阵与蚁群算法优化的特征子集搜索方法。该算法从特征核出发,蚁群依次选择概率大的特征加入特征核集,直至找到最小特征子集算法终止。通过实例验证和UCI数据集实验结果表明,与基于属性依赖度和信息熵属性重要度的特征选择方法相比,在通常情况下,该算法能较小代价找到最小特征子集,并且可以有效减少计算工作量。  相似文献   

15.
特征选择旨在从原始特征空间中选择一组规模较小的特征子集,在分类学习任务中提供与原集合近似或更好的性能.文中提出基于信息粒化的多标记特征选择算法,融合标记权重与样本平均间隔,将改进的邻域信息熵应用到特征选择过程中.在6组数据集以及5个评价指标上的实验表明文中算法在分类上的有效性.  相似文献   

16.
一种基于最大熵原理系统异常检测模型研究   总被引:1,自引:0,他引:1  
大多数基于系统调用序列分析的系统异常检测方法在对系统调用序列裁减和特征提取过程中没有客观评估特征表述进程行为的能力,其结果造成了许多误警、漏警问题,影响了检测性能.提出了一种基于最大熵原理的系统异常检测模型,通过计算互信息量和Z测试实现特征提取,通过构建最大熵模型实现特征评估与检测分类器.通过改进Bloom Filter算法实现高效的特征查找或匹配.较好的改善了系统异常检测的性能,对比实验结果证明,该检测模型能够以较高的精确度及时的检测出异常攻击行为.  相似文献   

17.
多路心音信号不仅比单路心音信号涵盖更多关于总体的特征,而且能够弥补单路心音数据携带的信息量可能不充分的缺陷。利用笔者自主设计的4路心音传感器,初步建立一个小型4路心音数据库。基于这个数据库,首先阐明多路心音信号的特点,论述心杂音与听诊位置的关系;然后分别提取心音的单路和4路能量熵系数、4路心音互信息作为有效特征数据集,利用PCA对能量熵特征进行降维处理,获得串行特征;将相关性特征和互信息特征从实向量空间拓展到复向量空间,进行并行融合,获得并行特征;最后将串行并行特征再次融合成为多元优化组合特征。这种融合策略,具有针对性强,凸显差异性的优点。仿真实验结果表明,由多路心音信号获取的多元优化组合特征表征效果明显优于单路心音信号的特征表征效果,不仅有益于分类模型的构建,而且对实现先心病的快速筛查,提高分类识别率具有积极的意义。  相似文献   

18.
针对人脸识别特征提取阶段中的数据降维方法往往难以兼顾保持全局与局部特征信息的问题,以及匹配识别阶段贝叶斯分类器中小样本问题,提出了一种融合全局与局部特征的贝叶斯人脸识别方法。该方法通过核主元分析提取出人脸数据的全局非线性特征,并在此基础上通过正交化局部敏感判别分析挖掘出人脸数据的局部流形结构信息,以达到提取出具有高判别力低维本质人脸特征的目的;采用一种最大信息量协方差选择的方法,来对协方差矩阵进行估算,以解决贝叶斯分类器设计中的小样本问题。在ORL、AR、 YALE、FLW人脸库上设计实验来进行验证。结果表明,提出的特征提取算法以及对贝叶斯分类器的改进取得了比较好的效果,通过对这两个阶段的优化,可以显著提升人脸识别的效果。  相似文献   

19.
针对标签排序问题的特点,提出一种面向标签排序数据集的特征选择算法(Label Ranking Based Feature Selection, LRFS)。该算法首先基于邻域粗糙集定义了新的邻域信息测度,能直接度量连续型、离散型以及排序型特征间的相关性、冗余性和关联性。然后,在此基础上提出基于邻域关联权重因子的标签排序特征选择算法。实验结果表明,LRFS算法能够在不降低排序准确率的前提下,有效剔除标签排序数据集中的无关特征或冗余特征。  相似文献   

20.
通过分析特征词与类别间的相关性,在原有卡方特征选择和信息增益特征选择的基础上提出了两个参数,使得选出的特征词集中分布在某一特定类,并且使特征词在这一类中出现的次数尽可能地多;最后集合CHI与IG两种算法得到一种集合特征选择方法(CCIF)。通过实验对比传统的卡方特征选择、信息增益和CCIF方法,CCIF方法使得算法的微平均查准率得到了明显的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号