期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张洪盛永健黄子龙刘晨曹毅《控制与决策》2022,37(6):1513-1520

针对实际工况中被测对象大多处于正常状态而引起故障样本稀缺、故障数据间存在差异,导致故障类别识别准确率不高的问题,基于密集卷积神经网络(DenseNet),提出一种减压阀样本数据不平衡下的故障诊断模型—–加权密集卷积神经网络(W-DenseNet).首先,将原始一维压力信号数据重构后转换为二维灰度图,作为模型的输入数据;... 相似文献

2.

基于元学习的不平衡少样本情况下的文本分类研究

熊伟宫禹《中文信息学报》2022,36(1):104-116

针对文本信息语义、语境迁移难问题,该文提出一种基于元学习与注意力机制模型的动态卷积神经网络改进方法.首先利用文本的底层分布特征进行跨类别分类,使文本信息具有更好的迁移性;其次使用注意力机制对传统的卷积网络进行改进,以提高网络的特征提取能力,并根据原始数据集信息进行编码,生成平衡变量,降低由于数据不平衡所带来的影响;最后... 相似文献

3.

应用于不平衡多分类问题的损失平衡函数

下载免费PDF全文

黄庆康宋恺涛陆建峰《智能系统学报》2019,14(5):953-958

传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。相似文献

4.

不平衡数据分类方法综述 总被引：1，自引：0，他引：1

李艳霞柴毅胡友强尹宏鹏《控制与决策》2019,34(4):673-688

随着信息技术的快速发展,各领域的数据正以前所未有的速度产生并被广泛收集和存储,如何实现数据的智能化处理从而利用数据中蕴含的有价值信息已成为理论和应用的研究热点.数据分类作为一种基础的数据处理方法,已广泛应用于数据的智能化处理.传统分类方法通常假设数据类别分布均衡且错分代价相等,然而,现实中的数据通常具有不平衡特性,即某一类的样本数量要小于其他类的样本数量,且少数类具有更高错分代价.当利用传统的分类算法处理不平衡数据时,由于多数类和少数类在数量上的倾斜,以总体分类精度最大为目标会使得分类模型偏向于多数类而忽略少数类,造成少数类的分类精度较低.如何针对不平衡数据分类问题设计分类算法,同时保证不平衡数据中多数类与少数类的分类精度,已成为机器学习领域的研究热点,并相继出现了一系列优秀的不平衡数据分类方法.鉴于此,对现有的不平衡数据分类方法给出较为全面的梳理,从数据预处理层面、特征层面和分类算法层面总结和比较现有的不平衡数据分类方法,并结合当下机器学习的研究热点,探讨不平衡数据分类方法存在的挑战.最后展望不平衡数据分类未来的研究方向. 相似文献

5.

基于样本投影分布的平衡不平衡数据集分类* 总被引：2，自引：0，他引：2

文传军詹永照《计算机应用研究》2009,26(8):3131-3133

提出一种平衡不平衡数据集统一分类方法,首先得到训练样本基于支持向量机（SVM）超平面法线方向上的投影;再借助支持向量数据描述（SVDD）对训练样本投影分布进行描述;测试样本在此基础上实现分类。平衡或不平衡数据集都可采用相同的方法进行分类。实验表明该方法能够同时对平衡或不平衡数据集进行有效的分类。相似文献

6.

基于差分孪生卷积神经网络的大规模不平衡数据分类算法

任佳丽王文晶《计算机应用与软件》2019,36(11)

传统基于支持向量机的不平衡数据分类算法包含矩阵运算,无法应用于大规模的不平衡数据集。针对这种情况,提出基于差分孪生卷积神经网络的大规模不平衡数据分类算法。设计差分卷积机制增强卷积神经网络的深度结构表示能力,在不改变滤波器数量的情况下提高模型的判别能力。通过差分孪生卷积神经网络分别优化每个类的特征图,每个类关联多个超平面,根据输入样本与超平面的距离决定输出样本的类标签。基于多组不平衡数据集的实验结果表明,该算法实现了较好的分类性能。相似文献

7.

基于改进Faster-RCNN的生活垃圾分类研究

葛焰刘心中《信息与电脑》2023,(8):95-98

随着人口的增长,生活垃圾分类问题日益突出。文章提出了一种基于改进快速的区域卷积神经网络（Faster-Region Convolutional Neural Network,Faster-RCNN）的生活垃圾分类方法,将特征提取网络改为ResNet50网络,并在区域推荐网络（Region Proposal Network,RPN）中使用K-means聚类算法。结果表明,基于改进Faster-RCNN的网络模型的准确率达到94.5%,具有较高的准确率和较快的分类速度,可为解决生活垃圾分类提供一种有效的技术手段。相似文献

8.

不平衡样本集的欠采样算法研究

韩芳孙立民《福建电脑》2014,(12):16-18

支持向量机在分类平衡样本集时的分类效果非常好,但是对不平衡样本集的分类效果并不理想。仔细分析样本集不平衡的原因,一是数量上的不平衡,二是样本点的空间重合。本文综合考虑数量和空间重合度这两点提出了改良式欠采样算法,降低样本集空间重合度和数量上的不平衡。通过仿真结果可以看出,本文的算法对不平衡样本集的分类效果较好。相似文献

9.

基于样本权重的不平衡数据欠抽样方法

熊冰妍王国胤邓维斌《计算机研究与发展》2016,53(11):2613-2622

现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此提出了一种基于样本权重的欠抽样方法KAcBag(K-means AdaCost bagging),该方法引入了样本权重来反映样本所处的区域,首先根据各类样本的数量初始化各样本权重,并通过多次聚类对各个样本的权重进行修改,权重小的多数类样本即处于多数类的中心区域;然后按权重大小对多数类样本进行欠抽样,使位于中心区域的样本较容易被抽中,并与所有少数类样本组成bagging成员分类器的训练数据,得到若干个决策树子分类器;最后根据各子分类器的正确率进行加权投票生成预测模型.对19组UCI数据集和某电信运营商客户换机数据进行了测试实验,实验结果表明:KAcBag方法使抽样所得的样本具有较强的代表性,能有效提高少数类的分类性能并缩小问题规模. 相似文献

10.

改进的不平衡贝叶斯学习分类模型研究

韩忠明《计算机应用研究》2020,37(12):3561-3564

基于函数逼近的方法存在少数类样本不足时分类效果不佳的问题,针对此问题提出了不平衡贝叶斯学习分类模型。模型引入类间隔似然函数,用于降低后验分布在参数空间上存在的偏态性,以采样到对各类样本分类精确的参数点。在UCI、KEEL上的公开不平衡数据集中的实验结果验证了所提方法的有效性;基于MINIST数据集构建了两个不平衡数据集,在这两个数据集中几何均值分别达到92.4%和81.6%。相似文献

11.

半监督学习在不平衡样本集分类中的应用研究 总被引：1，自引：1，他引：1

于重重商利利谭励涂序彦杨扬《计算机应用研究》2013,30(4):1085-1089

在对不平衡样本集进行分类时容易产生少数类样误差大的问题,而目前半监督学习中的算法多数是针对未有明显此类特征的数据集。针对一种半监督协同分类算法在该问题上的有效性进行了研究。由于进一步增强了分类器差异性,该算法在理论上对不平衡样本集具有良好的分类性能。根据该算法建立分类模型,利用其对桥梁结构健康数据进行分类实验,与Tri-Training算法的结果比较表明,该算法对不平衡样本集具有良好的适用性,从而验证了上述算法的有效性。相似文献

12.

不平衡数据分类研究综述 总被引：1，自引：1，他引：1

赵楠张小芳张利军《计算机科学》2018,45(Z6):22-27, 57

在很多应用领域中,数据的类别分布不平衡,如何对其正确分类是数据挖掘和机器学习领域中的研究热点。经典的数据分类算法未考虑数据类别的不平衡性,认为类别之间的误分类代价相同,导致不平衡数据分类的效果不理想。针对数据分类的各个步骤,相继提出了不同的不平衡数据分类处理方法。对多年来的相关研究成果进行归类分析,从特征选择、数据分布调整、分类算法、分类结果评估等几个方面系统地介绍了相关方法,并探讨了进一步的探索方向。相似文献

13.

面向不平衡数据的分类算法

下载免费PDF全文

蒋宗礼史倩月《计算机系统应用》2019,28(8):120-128

不平衡数据在分类时往往会偏向"多数"，传统过采样生成的样本不能较好的表达原始数据集分布特征.改进的变分自编码器结合数据预处理方法，通过少数类样本训练，使用变分自编码器的生成器生成样本，用于以均衡训练数据集，从而解决传统采样导致的不平衡数据引起分类过拟合问题.我们在UCI四个常用的数据集上进行了实验，结果表明该算法在保证准确率的同时提高了F_measure和G_mean. 相似文献

14.

基于样本密度峰值的不平衡数据欠抽样方法

苏俊宁叶东毅《计算机应用》2020,40(1):83-89

不平衡数据分类是数据挖掘和机器学习领域的一个重要问题,其中数据重抽样方法是影响分类准确率的一个重要因素。针对现有不平衡数据欠抽样方法不能很好地保持抽样样本与原有样本的分布一致的问题,提出一种基于样本密度峰值的不平衡数据欠抽样方法。首先,应用密度峰值聚类算法估计多数类样本聚成的不同类簇的中心区域和边界区域,进而根据样本所处类簇区域的局部密度和不同密度峰值的分布信息计算样本权重;然后,按照权重大小对多数类样本点进行欠抽样,使所抽取的多数类样本尽可能由类簇中心区域向边界区域逐步减少,在较好地反映原始数据分布的同时又可抑制噪声;最后,将抽取到的多数类样本与所有的少数类样本构成平衡数据集用于分类器的训练。多个数据集上的实验结果表明,与现有的RBBag、uNBBag和KAcBag等欠抽样方法相比,所提方法在F1-measure和G-mean指标上均取得一定的提升,是有效、可行的样本抽样方法。相似文献

15.

一种基于样本学习复杂度的不平衡数据过采样方法

许皓孙廷凯《计算机与数字工程》2020,48(8):1846-1851,1857

相似文献

16.

一种城市生活垃圾智能检测分类系统设计

刘禹辰朱娟《电子制作．电脑维护与应用》2022,(1):34-36,23

针对目前分类垃圾桶自控能力不足、分类效果差等问题,提出一种基于深度学习的城市生活垃圾智能检测分类系统设计,利用垃圾桶入口处的摄像机进行垃圾图像采样,再通过深度学习技术识别垃圾种类,进而触发分拣设备,实现生活垃圾精准分类投放.该系统具有高效、环保、节能等特点,在资源回收利用、保护环境等方面具有一定的应用价值. 相似文献

17.

卷积神经网络的聚焦均方损失函数设计

徐锐冯瑞《计算机系统应用》2020,29(10):133-140

为了提高卷积神经网络在人体姿势估计任务上的精度,提出了一种基于均方损失函数(Mean Squared Error,MSE)的改进损失函数来处理网络学习中回归热点图的前景(高斯核)和背景之间像素点不均衡问题,根据前景与背景不同像素点值对损失函数赋予不同权重,并将其命名为聚焦均方损失函数(Focus Mean Squared Error, FMSE).与均方损失函数相比,我们提出的聚焦均方损失函数可以有效地减少前景和背景之间像素点不均衡对网络性能的影响,帮助网络定位关键点的空间位置,提升了网络性能,并使得训练阶段中损失函数收敛速度更快.并在公开数据集上进行实验,以验证我们所提出的聚焦均方损失函数的有效性. 相似文献

18.

乳腺超声图像中易混淆困难样本的分类方法

下载免费PDF全文

杜章锦龚勋罗俊章哲敏杨菲《中国图象图形学报》2020,25(7):1490-1500

目的超声诊断常作为乳腺肿瘤首选的影像学检查和术前评估方法,但存在良恶性结节的图像表现重叠、诊断严重依赖医生经验,以及需要较多人机交互等问题。为减少误诊和不必要的穿刺活检率,以及提高诊断自动化程度,本文提出一种端到端的模型,实现结节区域自动提取及良恶性鉴别。方法就超声图像散斑噪声问题使用基于边缘增强的各向异性扩散去噪模型（edge enhanced anisotropic diffusion,EEAD）实现数据预处理,之后针对结节良恶性特征提出一个改进的损失函数以增强鉴别性能,通过形状描述符组合挖掘因形状与其他类别相似从而易导致错判的困难样本,为使该部分困难样本具有更好的区分性,应用改进的损失函数,并在此基础上构建困难样本形状约束损失项,用来调整形状相似但类别不同样本间的特征映射。结果为验证算法的有效性,构建了一个包含1 805幅图像的乳腺超声数据集,在该数据集上具有5年资历医生的平均判断准确率为85.3%,而本文方法在该数据集上分类正确率为92.58%,敏感性为90.44%,特异性为93.72%,AUC （area under curve）为0.946,均优于对比算法;相对传统Softmax损失函数,各评价指标提高了5% 12%。结论本文提出了一个端到端的乳腺超声图像分类方法,实用性强;通过将医学知识融合到优化模型,增加的困难样本形状约束损失项可提高乳腺肿瘤良恶性诊断的准确性和鲁棒性,各项评价指标均高于超声科医生,具有临床应用价值。相似文献

19.

零样本图像分类综述

刘靖祎史彩娟涂冬景刘帅《计算机科学与探索》2021,15(5):812-824

面对人工标注大量样本费时费力,一些稀有类别样本难于获取等问题,零样本图像分类成为计算机视觉领域的一个研究热点.首先,对零样本学习,包括直推式零样本学习和归纳式零样本学习进行了简单介绍;其次,重点介绍了基于空间嵌入零样本图像分类方法和基于生成模型零样本图像分类方法以及它们的子类方法,并对这些方法的机制、优缺点和适用场景等... 相似文献

20.

基于不平衡数据样本特性的新型过采样SVM分类算法

黄海松魏建安康佩栋《控制与决策》2018,33(9):1549-1558

针对传统采样方式准确率与鲁棒性不够明显,欠采样容易丢失重要的样本信息,而过采样容易引入冗杂信息等问题,以UCI公共数据集中的不平衡数据集Pima-Indians为例,综合考虑数据集正负类样本的类间距离、类内距离与不平衡度之间的关系,提出一种基于样本特性的新型过采样方式.首先对原始数据集进行距离带的划分,然后提出一种改进的基于样本特性的自适应变邻域Smote算法,在每个距离带的少数类样本中进行新样本的合成,并将此方式推广到UCI数据集中其他5种不平衡数据集.最后利用SVM分类器进行实验验证的结果表明:在6类不平衡数据集中,应用新型过采样SVM算法,相比已有的采样方式,少(多)数类样本的分类准确率均有明显提高,且算法具有更强的鲁棒性. 相似文献