首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了提高输配电大数据平台内部数据的识别效率和准确度,提出了全输配电大数据一体化平台信息自适应识别方法。采集并压缩原始记录信息与实时信息,计算平台信息中节点处于空闲状态与信息产生时的能耗,同时融合信息;采用小波函数构建分解模型,分解信息特征;将信息熵测度方法应用到识别中,设计识别流程;利用平台信息识别方法,进一步识别故障信息,以此实现全域输配电大数据一体化平台信息自适应识别。实验结果表明,所研究的识别方法有效提高了识别效率,并在有噪声与无噪声数据的情况下,都能准确识别出平台内部的相关数据,提高了识别准确度,满足了电力公司对数据信息管理的基本要求。  相似文献   

2.
为解决代码混淆算法有效性评估模型存在评价指标不全面、单一学习器泛化能力低的问题,提出一种融合自适应增强训练机制和Stacking算法的代码混淆算法有效性评估模型SDF-Stacking。构建一个包括强度、弹性、开销、隐蔽性4大特征的代码混淆有效性评价指标集合;在模型的基分类器训练阶段引入自适应增强训练机制,提高基分类器的预测精度和多样性;使用最大互信息算法做数据融合,增大元分类器训练数据信息量。实验结果表明,该模型在多个评价指标上均优于其它对比模型,准确率可达98.6%。  相似文献   

3.
向欣  陆歌皓 《计算机应用研究》2021,38(12):3604-3610
针对现实信用评估业务中样本类别不平衡和代价敏感的情况,为降低信用风险评估的误分类损失,提出一种基于DESMID-AD动态选择的信用评估集成模型,根据每一个测试样本的特点动态地选择合适的基分类器对其进行信用预测.为提高模型对信用差客户(小类)的识别能力,在基分类器训练前使用过采样的方法对训练数据作类别平衡,采用元学习的方式基于多个指标进行基分类器的性能评估并在此阶段设计权重机制增强小类的影响.在三个公开信用评估数据集上,以AUC、一型、二型错误率以及误分类代价作为评价指标,与九种信用评估常用模型做比较,证明了该方法在信用评估领域的有效性和可行性.  相似文献   

4.
最小总风险准则的贝叶斯网络个人信用评估模型*   总被引:1,自引:0,他引:1  
将最小总风险准则MOR与贝叶斯网络分类器相结合,提出了一种新型信用评估模型。在两个真实数据集上以MOR用10层交叉验证对贝叶斯网络信用评估模型进行了测试,并与最小错误概率准则MPE的贝叶斯网络分类器的结果进行了对比。结果表明,基于MOR的贝叶斯网络分类模型可以有效地减小信用评估风险。  相似文献   

5.
提出了一种基于自适应距离度量的最小距离分类器集成方法,给出了个体分类器的生成方法。首先用Bootstrap技术对训练样本集进行可重复采样,生成若干个子样本集,应用生成的子样本集建立自适应距离度量模型,根据建立的模型对子样本集进行训练,生成个体分类器。在集成中,将结果用相对多数投票法集成最终的结论。采用UCI标准数据集实验,将该方法与已有方法进行了性能比较,结果表明基于自适应距离度量的最小距离分类器集成是最有效的。  相似文献   

6.
传统方法受噪声点影响,存在分类精准低的问题。为此,提出基于聚类算法的海量医院财务数据精准分类方法。在对大数据去噪原理基础上,通过PNCC模型对财务数据去噪处理,避免噪声对数据分类结果产生影响;采取自适应邻域选择方法降维处理去噪后财务数据,构建聚类算法中QS-KFCM模型,将预处理后医院财务数据输入QS-KFCM模型中,完成海量医院财务数据的精准分类。实验表明方法可有效提高财务数据分类精度。  相似文献   

7.
针对信用数据中的高维稀疏特征与样本不平衡问题易导致模型分类性能欠佳,提出一种新颖的框架来构建信用评分模型。首先,通过计算特征相似度解决高维稀疏特征;其次针对样本不平衡问题提出基于特征聚类改进的SMOTE方法(FC-SMOTE),以平衡数据集进而提高模型分类性能;最后,采用XGBoost作为基分类器构建信用评分模型。选择网上公开的真实信用数据及UCI数据库中的信用数据进行实验,和传统过采样方法 SMOTE、Borderline SMOTE、ADASYN进行对比,实验结果表明,提出的FC-SMOTE方法使基于XGBoost构建的信用评分模型具有更高预测精度。  相似文献   

8.
通过对欧氏距离度量的分析,提出了自适应距离度量.首先利用训练样本建立自适应距离度量模型,该模型保证了训练样本到相同模式类的距离最近,到不同模式类的距离最远,根据该模型建立目标函数,求解目标函数,得到最优权重.基于最小距离分类器和K近邻分类器,采用UCI标准数据库中部分数据,对提出的自适应距离度量和欧氏距离度量进行了实验比较,实验结果表明自适应距离度量更有效.  相似文献   

9.
目的 目前高光谱图像决策融合方法主要采用以多数票决(majority vote,MV)为代表的硬决策融合和以对数意见池(logarithmic opinion pool,LOGP)为代表的软决策融合策略。由于这些方法均使用统一的权重系数进行决策融合,没有对子分类器各自的分类性能进行评估而优化分配权重系数,势必会影响最终的分类精度。针对该问题,本文对多数票决和对数意见池融合策略进行了改进,提出了面向高光谱图像分类的自适应决策融合方法。方法 根据相关系数矩阵对高光谱图像进行波段分组,对每组波段进行空谱联合特征提取;利用高斯混合模型(Gaussian mixture model,GMM)或支持向量机(support vector machine,SVM)分类器对各组空谱联合特征进行分类;最后,采用本文研究的两种基于权重系数优化分配的自适应融合策略对子分类器的分类结果进行决策融合,使得分类精度低的波段组和异常值对最终分类结果的影响达到最小。结果 对两个公开的高光谱数据集分别采用多种特征和两种分类器组合进行实验验证。实验结果表明,在相同特征和分类器条件下,本文提出的自适应多数票决策融合策略(adjust majority vote,adjustMV)、自适应对数意见池决策融合策略(adjust logarithmic opinion pool,adjustLOGP)比传统的MV决策融合策略、LOGP决策融合策略对两个数据集的分类精度均有大幅度提高。Indian Pines数据集上,adjustMV算法的分类精度比相应的MV算法平均提高了1.2%,adjustLOGP算法的分类精度比相应的LOGP算法平均提高了7.38%;Pavia University数据集上,adjustMV算法的分类精度比相应的MV算法平均提高了2.1%,adjustLOGP算法的分类精度比相应的LOGP算法平均提高了4.5%。结论 本文提出的自适应权重决策融合策略为性能较优的子分类器(即对应于分类精度高的波段组)赋予较大的权重,降低了性能较差的子分类器与噪声波段对决策融合结果的影响,从而大幅度提高分类精度。所研究的决策融合策略的复杂度和计算成本均较低,在噪声环境中具有更强的鲁棒性,同时在一定程度上解决了高光谱图像分类应用中普遍存在的小样本问题。  相似文献   

10.
针对传统单个分类器在不平衡数据上分类效果有限的问题,基于对抗生成网络(GAN)和集成学习方法,提出一种新的针对二类不平衡数据集的分类方法——对抗生成网络-自适应增强-决策树(GAN-AdaBoost-DT)算法。首先,利用GAN训练得到生成模型,生成模型生成少数类样本,降低数据的不平衡性;其次,将生成的少数类样本代入自适应增强(AdaBoost)模型框架,更改权重,改进AdaBoost模型,提升以决策树(DT)为基分类器的AdaBoost模型的分类性能。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在信用卡诈骗数据集上的实验分析表明,该算法与合成少数类样本集成学习相比,准确率提高了4.5%,受测者工作特征曲线下面积提高了6.5%;对比改进的合成少数类样本集成学习,准确率提高了4.9%,AUC值提高了5.9%;对比随机欠采样集成学习,准确率提高了4.5%,受测者工作特征曲线下面积提高了5.4%。在UCI和KEEL的其他数据集上的实验结果表明,该算法在不平衡二分类问题上能提高总体的准确率,优化分类器性能。  相似文献   

11.
使用反映数据变化机制的自适应模型可以更好处理数据流问题。为实现自适应调整集成分类器使其更符合数据特性,提出一种基于动态异构集成的多标签数据流分类算法。通过使用H个不同分类算法分别训练固定大小的数据块,生成候选分类器组E={E1,…,EH},利用几何加权公式计算每个Ei中候选基分类器的权重实现组内的动态更新;提出一种新的自适应选择策略生成最终的异构集成分类器。通过在6个数据集上的大量实验验证,提出算法比现有算法在准确度、基于实例的F1值、微观F1值、宏观F1值上有更好的性能。  相似文献   

12.
对客户进行电信用评估是电力公司实现营销精益化管理的重要任务,现有相关方法较多地依赖经验规则确定评估模型,研究提出了基于电力客户缴费积极性的信用值定量化评估新模型。首先提出以加权正则化付费周期值衡量客户缴费积极性,随后基于理论分析及客户真实缴费数据推断获得评估模型,不依赖主观经验地实现了电力客户缴费信用值的连续量化评估。理论及实验分析表明,新方法具备较好的理论依据及真实数据分析结果的支撑,能够合理有效地量化反映客户的电力消费信用。  相似文献   

13.
针对AdaBoost算法不能有效提高RVM分类性能的问题,提出一种基于信息熵的RVM与AdaBoost组合分类器。依据RVM输出的后验概率来定义样本的信息熵,信息熵越高的样本越容易错分。提出使用自适应信息熵阈值对数据进行筛选,筛选出的数据使用基于AdaBoost算法的集成分类器进行分类,样本的分类结果由RVM与集成分类器组合给出。把未筛选出且分类错误的极少样本作为噪声对待,增强了组合分类器的稳定性,避免了随着AdaBoost算法迭代次数增加集成分类器出现退化的现象。使用UCI数据集从分类正确率、分类效率和稳定性三方面对提出的组合分类器进行验证,实验结果表明了此分类器的有效性。  相似文献   

14.
准确的信用风险评估可以降低金融机构的风险。为了进一步提高信用风险评估模型的预测准确率,将基于SVM的集成学习模型应用到信用风险评估问题中,提出了一种混合集成策略,称作RSA。RSA是随机子集模型和AdaBoost两种流行策略的合成,能提高组合成员分类器的多样性,从而提高集成学习模型的预测准确率。模型在两组公开信用数据集上进行了应用,实验结果表明基于RSA的SVM的集成学习模型可以作为信用风险评估的有效模型。  相似文献   

15.
随着计算机技术的发展,利用机器学习算法构建自动化评估模型已经成为金融机构进行信用评估的重要手段。然而,目前信用评估模型仍存在一些问题:信用数据本身存在类别不平衡和高维特征的问题,并且不同的时间下外界环境的改变会影响信用主体的行为,即数据会产生概念漂移现象。为此,文中提出了一个动态的信用评估模型,通过集成学习在新的增量数据上训练基分类器,并对各个基分类器的权重进行动态调整来适应概念漂移,以实现模型的动态更新。当发生概念漂移时,会针对概念漂移的检测结果对高维不平衡的信用数据进行不同形式的均衡化和特征选择。特别地,针对特征选择,文中提出了结合历史代表性样本的增量特征选择算法,该算法能够进行高效准确的特征选择,从而使模型可以同时解决增量信用数据存在的高维不平衡和概念漂移问题。最后,文中选取了真实的增量高维信用数据集,验证了所提算法相比其他主流算法在准确率和效率上的优越性。  相似文献   

16.
田臣  周丽娟 《计算机应用》2019,39(6):1707-1712
针对信用评估中最为常见的不均衡数据集问题以及单个分类器在不平衡数据上分类效果有限的问题,提出了一种基于带多数类权重的少数类过采样技术和随机森林(MWMOTE-RF)结合的信用评估方法。首先,在数据预处理过程中利用MWMOTE技术增加少数类别样本的样本数;然后,在预处理后的较平衡的新数据集上利用监督式机器学习算法中的随机森林算法对数据进行分类预测。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在UCI机器学习数据库中的德国信用卡数据集和某公司的汽车违约贷款数据集上的仿真实验表明,在相同数据集上,MWMOTE-RF方法与随机森林方法和朴素贝叶斯方法相比,AUC值分别提高了18%和20%。与此同时,随机森林方法分别与合成少数类过采样技术(SMOTE)方法和自适应综合过采样(ADASYN)方法结合,MWMOTE-RF方法与它们相比,AUC值分别提高了1.47%和2.34%,从而验证了所提方法的有效性及其对分类器性能的优化。  相似文献   

17.
为了提高专利数据挖掘的准确性和可靠性,针对基于专利数据的电力标引信息挖掘技术进行研究。以SIPO专利数据库为数据源,生成专利数据序列。根据词嵌入模型设计Word2Vec,获取电力专利数据关联信息。根据数据关联融合结果,通过支持向量机分别训练相应子分类器,高效融合各子分类器,构建总分类模型完成分类决策,根据最终决策获取电力专利数据标引信息挖掘结果。实验结果表明,提出的挖掘与其他挖掘法相比查准率和查全率更高,具有可靠性。  相似文献   

18.
处理类不平衡数据时,少数类的边界实例非常容易被错分。为了降低类不平衡对分类器性能的影响,提出了自适应边界采样算法(AB-SMOTE)。AB-SMOTE算法对少数类的边界样本进行自适应采样,提高了数据集的平衡度和有效性。同时将AB-SMOTE算法与数据清理技术融合,形成基于AdaBoost的集成算法ABTAdaBoost。ABTAdaBoost算法主要包括三个阶段:第一个阶段对训练数据集采用AB-SMOTE算法,降低数据集的类不平衡度;第二个阶段使用Tomek links数据清理技术,清除数据集中的噪声和抽样方法产生的重叠样例,有效提高数据的可用性;第三个阶段使用AdaBoost集成算法生成一个基于N个弱分类器的集成分类器。实验分别以J48决策树和朴素贝叶斯作为基分类器,在12个UCI数据集上的实验结果表明:ABTAdaBoost算法的预测性能优于其它几种算法。  相似文献   

19.
本文提出一种融合标签自适应重构机制的半监督情感分类方法,用于实现对数据噪声的标注与过滤。本文将提出的标签自适应重构机制分别引入到逻辑回归、随机森林、朴素贝叶斯及线性支持向量机情感分类算法中,以西安疫情防控为例采集微博、豆瓣及知乎等社交媒体上的网络舆情数据,基于上述构建的社交网络数据进行验证实验。实验结果表明,本文提出的融合标签自适应机制的情感分类模型在情感分类准确性上有显著提升。  相似文献   

20.
基于传统模型的实际分类问题,不均衡分类是一个常见的挑战问题。由于传统分类器较难学习少数类数据集内部的本质结构,导致更多地偏向于多数类,从而使少数类样本被误分为多数类样本。与此同时,样本集中的冗余数据和噪音数据也会对分类器造成困扰。为有效处理上述问题,提出一种新的不均衡分类框架SSIC,该框架充分考虑数据统计特性,自适应从大小类中选取有价值样本,并结合代价敏感学习构建不均衡数据分类器。首先,SSIC通过组合部分多数类实例和所有少数类实例来构造几个平衡的数据子集。在每个子集上,SSIC充分利用数据的特征来提取可区分的高级特征并自适应地选择重要样本,从而可以去除冗余噪声数据。其次,SSIC通过在每个样本上自动分配适当的权重来引入一种代价敏感的支持向量机(SVM),以便将少数类视为与多数类相等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号