首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 281 毫秒
1.
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法.首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除...  相似文献   

2.
张俐  陈小波 《电子与信息学报》2021,43(10):3028-3034
特征选择是机器学习、自然语言处理和数据挖掘等领域中数据预处理阶段必不可少的步骤。在一些基于信息论的特征选择算法中,存在着选择不同参数就是选择不同特征选择算法的问题。如何确定动态的非先验权重并规避预设先验参数就成为一个急需解决的问题。该文提出动态加权的最大相关性和最大独立性(WMRI)的特征选择算法。首先该算法分别计算新分类信息和保留类别信息的平均值。其次,利用标准差动态调整这两种分类信息的参数权重。最后,WMRI与其他5个特征选择算法在3个分类器上,使用10个不同数据集,进行分类准确率指标(fmi)验证。实验结果表明,WMRI方法能够改善特征子集的质量并提高分类精度。  相似文献   

3.
张俐  陈小波 《电子与信息学报》2022,43(10):3028-3034
特征选择是机器学习、自然语言处理和数据挖掘等领域中数据预处理阶段必不可少的步骤.在一些基于信息论的特征选择算法中,存在着选择不同参数就是选择不同特征选择算法的问题.如何确定动态的非先验权重并规避预设先验参数就成为一个急需解决的问题.该文提出动态加权的最大相关性和最大独立性(WMRI)的特征选择算法.首先该算法分别计算新分类信息和保留类别信息的平均值.其次,利用标准差动态调整这两种分类信息的参数权重.最后,WMRI与其他5个特征选择算法在3个分类器上,使用10个不同数据集,进行分类准确率指标(fmi)验证.实验结果表明,WMRI方法能够改善特征子集的质量并提高分类精度.  相似文献   

4.
吕子敬  韩顺利  张志辉  刘磊 《红外》2016,37(1):40-44
大规模的红外光谱数据集中存在大量无关冗余的特征。针对这一问题,提出了一种动态赋权红外光谱特征选择算法(Dynamic Weight Infrared Spectrum Feature Selection Algorithm, MBDWFS)。 该算法把对称不确定性度量标准与近似Markov Blanket相结合,以删除原始光谱数据集中无关冗余的特征,从而获取数据规模较小且最优的特征子集。通过与 FCBF、ID$_3$ 和ReliefF三种经典特征选择算法的性能仿真对比试验,证明所提出的MBDWFS算法在整体分类性能上优于其他三种算法,用于红外光谱的物质分析领域时效果更好。  相似文献   

5.
阐述现阶段大数据应用的基础上,从人工智能角度出发进行数据挖掘的算法研究。基于支持度和置信度的关联分类算法难以有效度量类别和项集之间的相关性,因此容易产生许多质量不高的规则。提出了一种基于余弦度量的关联分类算法——IACD。IACD算法在挖掘关联规则时使用余弦度量来度量项集与类别间的相关性;其次,提出了一种新的规则强度对规则进行排序、剪枝以减少冗余规则的数量。实验结果表明,IACD算法有效地提高了规则质量,在多个UCI数据集上具有较高的分类准确率。  相似文献   

6.
党宏社  白梅  张娜 《电视技术》2015,39(19):10-13
为对自然图像有效准确地分类,提出了一种对图像低层特征和KNN分类算法中的近邻样本分别进行加权的分类方法。针对不同类别图像的视觉特征的差异,通过ReliefF算法计算训练集中每个类别的特征权值,利用此权值来改进待测图像与训练集中图像的距离度量;按照不同近邻到待测样本的距离远近,为不同近邻赋予权值来改进KNN算法在类别决策上的不足。实验结果表明该方法较传统KNN和特征加权KNN方法,准确性提高且对不同K值具有良好的鲁棒性。  相似文献   

7.
针对说话人分段与聚类算法中先验知识不足的问题,利用基于信息瓶颈(IB)准则和基于隐马尔科夫模型(HMM)/高斯混合模型(GMM)方法间的互补性,提出了一种基于特征层融合的说话人分段与聚类算法。该算法将基于IB准则算法的输出结果进行对数变换和降维处理;然后利用变换后的特征与传统梅尔频率倒谱系数(MFCC)特征分别训练说话人GMM模型,并在得分域对说话人类别的得分进行加权融合;根据融合的得分,进行基于HMM/GMM模型的说话人分段与聚类。实验表明,融合后的特征可以为系统提供更多的先验信息,比传统方法的误配率降低了1.2%。  相似文献   

8.
基于U分布的PolSAR图像无监督MAP分类方法   总被引:1,自引:1,他引:0  
结合U分布对不同匀质性极化合成孔径雷达(PolSAR)数据的广泛建模能力及Potts马尔科夫随机场(MRF)模型对像素点之间类相关性的建模能力,提出了一种基于最大后验概率(MAP)准则的PolSAR图像无监督分类方法。利用迭代条件模式算法和Metropolis采样算法对像素点的类别进行更新,迭代过程中分布参数的估计采用基于梅林(Mellin)变换的矩阵对数累积量方法,以迭代过程中出现次数最多的类别最为像素点的最终分类结果。利用NASA/JPL实验室AIRSAR系统获取旧金山湾的PolSAR数据,对本文分类算法的有效性以及分布的杂波建模能力进行了仿真验证。实验结果表明,本文分类算法的精度优于Lee分类算法,分布对PolSAR数据的杂波建模准确性总体上优于复Wishart分布、K分布和G0分布。  相似文献   

9.
LWF链图结构学习旨在发现链图中所有节点的父节点、子节点、邻居节点以及配偶节点.然而,目前最新的LWF链图结构学习算法是基于Growing-Shrinking(GS)思想得到节点的局部结构(即节点的马尔科夫毯)来学习全局网络结构,该类算法的条件独立测试是以整个马尔科夫毯为条件集的,为了保证条件独立测试的可靠性,算法要求样本数量是马尔科夫毯大小的指数级,从而使得算法的数据效率较差.针对该问题,本文提出了一种基于约束的局部-全局LWF链图结构学习算法.该算法通过迭代的学习邻接集和配偶集来降低对数据样本量的要求;与此同时,在学习邻接集时采用后向策略保障了条件独立测试的正确性.算法的基本思想如下:首先学习网络中每个节点的马尔科夫毯,将节点马尔科夫毯学习拆分为学习邻接集和学习配偶集;然后利用节点的马尔科夫毯信息恢复网络骨架,根据链图复合体有向边的特点,利用条件独立测试确定网络复合体有向边,从而恢复链图结构.理论分析证明了该算法的正确性,在仿真数据集和标准数据集上的实验测试验证了算法的有效性.  相似文献   

10.
高维数据中存在着成千上万个特征,大量的特征导致问题搜索空间过大,增加了计算代价,影响了数据分类预测的准确性.为了提高特征选择的效率,本文提出了一种对称不确定性和种群降维机制的粒子群特征选择算法,该算法设计了一种基于对称不确定性指标的初始化方法,降低特征选择的计算代价.通过非支配排序的种群降维机制,减少进化过程中冗余特征的影响.在5个公开生物医学的高维数据集上的实验结果表明,该算法能够针对高维数据特征选择问题取得更好的分类精度和更小的最优子集特征个数,并在时间运行方面有一定的优势.  相似文献   

11.
A new SVM based emotional classification of image   总被引:1,自引:0,他引:1  
How high-level emotional representation of art paintings can be inferred from perceptual level features suited for the particular classes (dynamic vs. static classification) is presented. The key points are feature selection and classification. According to the strong relationship between notable lines of image and human sensations, a novel feature vector WLDLV (Weighted Line Direction-Length Vector) is proposed, which includes both orientation and length information of lines in an image. Classification is performed by SVM (Support Vector Machine) and images can be classified into dynamic and static. Experimental results demonstrate the effectiveness and superiority of the algorithm.  相似文献   

12.
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征.将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度.  相似文献   

13.
利用灰度和纹理特征的SAR图像分类研究   总被引:2,自引:1,他引:1  
多类别多特征量情况下的合成孔径雷达(SAR)图像的目标分类是一个难以解决的问题.从灰度和纹理模型出发,提出了综合利用灰度和纹理特征的目标分类方法.均值和方差是灰度模型中重要的特征统计量,而能量、熵、对比度、局部相似性和相关性是纹理模型中重要的特征统计量.灰度和纹理特征能确切地描述SAR图像中的目标.通过构造特征向量,定义向量之间的距离,并按照最小距离方法进行目标分类.以一定大小的窗口读入样本,提高了算法的运行速度和抗噪能力.理论上,窗口越大,特征向量值越接近真实值.窗口越小,边缘的分类精度越高.实验表明该方法较好地处理了多类别多特征量情况下的SAR图像分类问题,分类结果是有效的,这为SAR图像目标分类提供了一条简单可行的途径.  相似文献   

14.
针对高光谱图像谱段数目较多、近邻谱段相关性过高而导致分类困难的问题,提出了一种自适应差分进化特征选择的高光谱图像分类算法.首先初始化种群向量集,利用自适应差分进化算法搜索特征的自适应性生成特征子集;然后,通过使用ReliefF技术根据特征排序去除重复特征,从而为所有的特征构建一个特征列表;最后,借助于模糊k-近邻分类器计算每个向量的分类精度,利用包裹模型评估特征子集.在印第安纳数据集和KSC数据集上的实验结果验证了算法的有效性及可靠性,实验结果表明,相比其他几种特征选择算法,该算法取得了更高的总分类精度和更好的Kappa系数.  相似文献   

15.
K-nearest neighbor (KNN) has yielded excellent performance in physiological signals based on emotion recognition. But there are still some issues:the majority vote only by the nearest neighbors is too simple to deal with complex (like skewed) class distribution; features with the same contribution to the similarity will degrade the classification accuracy; samples in boundaries between classes are easily misclassified when k is larger. Therefore, we propose an improved KNN algorithm called WB-KNN, which takes into account the weight (both features and classification) and boundaries between classes. Firstly, a novel weighting method based on the distance and farthest neighbors named WDF is proposed to weight the classification, which improves the voting accuracy by making the nearer neighbors contribute more to the classification and using the farthest neighbors to reduce the weight of non-target class. Secondly, feature weight is introduced into the distance formula, so that the significant features contribute more to the similarity than noisy or irrelevant features. Thirdly, a voting classifier is adopted in order to overcome the weakness of KNN in boundaries between classes by combining different classifiers. Results of WB-KNN algorithm are encouraging compared with the traditional KNN and other classification algorithms on the physiological dataset with a skewed class distribution. Classification accuracy for 29 participants achieves 94.219 2% for the recognition of four emotions.  相似文献   

16.
Feature selection (FS) is a process to select features which are more informative.It is one of the important steps in knowledge discovery.The problem is that not all features are important.Some of the features may be redundant,and others may be irrelevant and noisy.The conventional supervised FS methods evaluate various feature subsets using an evaluation function or metric to select only those features which are related to the decision classes of the data under consideration.However,for many data mining applications,decision class labels are often unknown or incomplete,thus indicating the significance of unsupervised feature selection.However,in unsupervised learning,decision class labels are not provided.In this paper,we propose a new unsupervised quick reduct (QR) algorithm using rough set theory.The quality of the reduced data is measured by the classification performance and it is evaluated using WEKA classifier tool.The method is compared with existing supervised methods and the result demonstrates the efficiency of the proposed algorithm.  相似文献   

17.
Vibrations produced by the use of industrial machine tools can contain valuable information about the state of wear of tool cutting edges. However, extracting this information automatically is quite difficult. It has been observed that certain structures present in the vibration patterns are correlated with dullness. We present an approach to extracting features present in these structures using self-organizing feature maps (SOFMs). We have modified the SOFM algorithm in order to improve its generalization abilities and to allow it to better serve as a preprocessor for a hidden Markov model (HMM) classifier. We also discuss the challenge of determining which classes exist in the machining application and introduce an algorithm for automatic clustering of time-sequence patterns using the HMM. We show the success of this algorithm in finding clusters that are beneficial to the machine-monitoring application  相似文献   

18.
利用SVM的极化SAR图像特征选择与分类   总被引:1,自引:0,他引:1  
该文提出一种新的利用SVM的特征选择算法,并将其融入到极化SAR图像分类过程中,构成一种新的基于SVM的分类方法。其中,特征选择算法利用支持向量个数作为特征评估指标,并以顺序后退法作为搜索策略。真实数据的实验结果表明,该分类方法能有效降低SVM分类器对自身参数的敏感性,与利用原始特征集和经典的RELIEF-F的分类方法相比,该方法能以更少(或相当)的特征个数,在更广泛的SVM参数取值范围内获得更高的分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号