共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
3.
大多数非均衡数据集的研究集中于重构数据集或者代价敏感学习,针对数据集类分布非均衡和不相等误分类代价往往同时发生这一事实,在简要回顾代价敏感学习理论和现有学习算法的基础上,将所提出的自适应混合重取样算法,与基于最小误分类代价的MetaCost算法分别进行实验比较,实验表明所提出算法在代价敏感学习中具有一定的优势,实验结果显示非均衡类对代价敏感学习算法性能产生较大影响,当样本类别差异较大时,用样本类空间重构的方法可以得到较好的分类效果. 相似文献
4.
5.
企业员工在职及离职数据集往往具有高度非均衡的特点,因此使用传统支持向量机(Support Vector Machine,SVM)分类算法来对非平衡的企业员工数据集进行分类并进行离职预测时,往往会导致分隔超平面向少数类偏移,分类准确率不佳等情况.为解决以上问题,本文首先通过SMOTE过采样方法有效地减少数据集的非均衡性,... 相似文献
6.
7.
8.
9.
10.
糖尿病视网膜病变(DR)是糖尿病的常见并发症,是目前世界范围内导致失明的主要疾病之一。临床的早期阶段很难检测到DR。本文提出一种基于卷积神经网络的计算机辅助诊断方法,根据眼底的图像自动分类DR的严重程度。采用多种预处理方法提高输入图像的质量,并且采用多种数据增强的方法来提高数据集的均衡性。使用代价敏感正则化扩展标准分类损失函数,根据预测等级和真实等级相差程度的不同,对其施加不同的惩罚。在ImageNet数据集上进行预训练,从而引入迁移学习,并且使用Softmax激活函数的全连接层使模型获得更好的性能。基于两个数据集的实验结果表明,相较于近期学者的研究结果,该模型能够实现二次加权kappa分数约5%的改善,AUC约3%的改善。将代价敏感正则化引入到EfficientNet网络模型可以提高糖尿病视网膜病变分类任务的准确率,能够得到很好的模型性能。 相似文献
11.
软件质量预测建模技术是软件质量评价体系中的关键技术,它能够对用户所关心的软件质量特性进行评价。预测模型常常用来发现度量数据和质量要素两者之间的关系,但二者的关系常常复杂而非线性,传统的建模方法受到限制,而人工神经网络技术是一种对非线性关系的建模方法。 相似文献
12.
目前,链路预测的研究主要针对拓扑结构变化缓慢的社交网络,集中在单节点对的链路预测.本文针对拓扑变化频繁的机会网络,提出一种基于模式分类的多节点间链路预测方法.该方法基于混沌时间序列理论确定机会网络的切片时间,采用状态图表征网络的拓扑结构,借助深度卷积神经网络在特征提取上的优势,从状态图的演化过程中提取机会网络的结构特征,根据当前特征推断未来链路的演化模式,实现多节点间的链路预测.在ITC(Imote-Traces-Cambridge)真实数据集上的实验结果表明,相比于基于CN(Common Neighbor)、AA(Adamic-Adar)、Katz等预测方法,本文方法具有更好的精度和稳定性. 相似文献
13.
14.
本文在分析已有软件故障预测方法后指出:单纯从软件开发过程的某个阶段或基于几种度量来预测软件故障是不充分的.提出综合利用软件开发过程信息构建基于BBNs软件故障预测模型.本文从一个基本的贝叶斯信念网(BBNs)故障预测模型出发,扩展基本节点,得到了一个较完善的故障预测模型,结合已有的关于软件度量的研究成果,提出利用软件度量和专家知识确定节点状态概率分布.仿真实验结果表明该模型与实际情况相符合,具有一定的故障预测能力. 相似文献
15.
基于相空间重构的非线性预测思想,建立一个时滞的BP神经网络模型,采用贝叶斯正则化方法提高BP网络的泛化能力,区别于一般的预测方法,非线性预测不仅注重数据拟合和精度改进,而且能够反映被预测系统的非线性特征。将该模型应用于某电子行业进出口贸易非线性时间序列的预测,结果证明改进的模型具有较好的泛化能力,准确拟合了进出口贸易发展的历史值和趋势。并在分析模型预测精度的同时,通过计算拟合序列和原序列的非线性特征量进行模型评价,证实预测模型能够合理地“捕捉”到产生原序列的非线性系统的动力学特征。 相似文献
16.
17.
18.
《电子学报:英文版》2016,(6):1089-1096
We present a semi-supervised approach for software defect prediction.The proposed method is designed to address the special problematic characteristics of software defect datasets,namely,lack of labeled samples and class-imbalanced data.To alleviate these problems,the proposed method features the following components.Being a semi-supervised approach,it exploits the wealth of unlabeled samples in software systems by evaluating the confidence probability of the predicted labels,for each unlabeled sample.And we propose to jointly optimize the classifier parameters and the dictionary by a task-driven formulation,to ensure that the learned features (sparse code) are optimal for the trained classifier.Finally,during the dictionary learning process we take the different misclassification costs into consideration to improve the prediction performance.Experimental results demonstrate that our method outperforms several representative stateof-the-art defect prediction methods. 相似文献