首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在多标签分类问题中,标签之间往往是相关的,为了提高分类性能,利用标签之间的相关性,提出AdaBoost.MLR算法和标签相关性分析方法。AdaBoost.MLR算法采用余弦相似度来计算标签相关性矩阵,利用标签相关性矩阵对原始标签矩阵进行补全转换为模糊标签矩阵,将标签空间划分为标签集、标签相关集和标签无关集,结合标签之间的相关性和弱分类器的分类情况,对样本权重进行调整。AdaBoost.MLR算法也能解决多类别分类问题,在其标签相关性的计算中,根据已经训练的弱分类器得到的临时强分类器的分类结果,构造标签相似性矩阵。实验结果表明,文中提出的算法在实验数据集上优于现有的算法,尤其在标签相关性复杂的数据集上分类性能有显著提升。  相似文献   

2.
为保证交通检测数据的准确性并服务于实时的交通状态判别和预测,交通大数据采用多种检测源数据协同处理并利用机器学习的方法进行异常识别.异常检测数据的识别主要基于机器学习中AdaBoost方法实现.在算法的训练过程中,为消除单一检测源数据的离群现象,训练数据选取同一路段上多种检测源提供的数据集.在算法的决策过程中,通过代价敏感方法的优势来改进AdaBoost的决策.实验结果表明:基于非均衡特性改进的AdaBoost模型迫使分类器更加关注了待识别的异常样本,增强了AdaBoost决策过程中训练决策树规则的代表性,提高了异常类样本的分类准确率.高速公路实例检测数据集验证了改进算法与相关经典算法的检测准确度、误检率、误警率等指标,其中改进模型与原模型相比,准确率提高了5.547%,误检率减低了6.792%.多种算法的ROC曲线对比表明改进的AdaBoost方法筛选交通检测样本的可靠度更高,可有效调整由非平衡数据导致的分类误差.  相似文献   

3.
为了提高AdaBoost集成学习算法的数据分类性能,提出基于合群度-隶属度噪声检测及动态特征选择的改进AdaBoost算法. 综合考虑待检测样本与邻居样本的相似度及与不同类别样本集的隶属关系,引入合群度和隶属度的概念,提出新的噪声检测方法. 在此基础上,为了更好地选择那些能够有效区分错分样本的特征,在传统过滤器特征选择方法的基础上提出通用的结合样本权重的动态特征选择方法,以提高AdaBoost算法针对错分样本的分类能力. 以支持向量机作为弱分类器,在8个典型数据集上分别从噪声检测、特征选择及现有方法比较3个方面进行实验. 结果表明,所提算法充分考虑了噪声样本和样本权重对AdaBoost分类结果的影响,相对于传统算法在分类性能上获得显著提升.  相似文献   

4.
电力变压器故障的准确诊断对于电网的可靠运行至关重要.为此,提出一种基于贝叶斯网络和假设检验的溶解气体分析的新型多分类概率诊断模型.该贝叶斯网络模型可嵌入专家知识,从数据中学习数据模式并推断与诊断结果相关的不确定性,并且通过假设检验环节改进数据的选择过程.最后,基于IEC TC10数据集,对比3种传统诊断方法进行诊断实验,验证所提出模型的有效性.结果 表明提出的诊断模型最大诊断准确性为88.9%,相比传统诊断方法有较大提升.  相似文献   

5.
针对心脏瓣膜疾病模糊分类问题,提出了基于多标签AdaBoost的模糊分类改进算法。结合模糊集理论,采用隶属函数将疾病的严重程度映射到区间[0,1]内的实数值,将超声诊断结果用模糊标签向量表示。利用余弦相似性分析疾病之间的复杂关系,计算标签相关性矩阵并对模糊标签向量进行补充。结合实际问题选取合适的阈值,将标签空间划分为标签集、标签相关集和标签无关集。本文算法以最小化排序损失为目标,针对不同的标签给予不同的权值调整因子,调整样本权重更新速度,强迫弱分类器“关注”与样本标签相关性较高的标签。在临床超声心动图TEE监测数据集上的实验结果表明:在对超声诊断结果模糊化时,通过隶属函数将疾病的严重程度中的“无病”映射为0,“轻度”映射到区间[0.8,0.85],“中度”映射到区间[0.85,0.9],“重度”映射到区间[0.9,1],构造模糊标签矩阵,并通过标签相关性矩阵对其进行补充,此时所构造的分类器性能达到最优。将本文算法与AdaBoost.MLR算法、AdaBoost.MR算法、BPMLL算法、RankSVM算法和MLkNN算法进行对比分析,在多标签分类的5种评价指标上,本文算法的分类性能均优于其他对比算法,分类结果更接近超声诊断结果。相较于AdaBoost.MLR算法,本文算法的Ranking Loss 下降了15.8%左右, One error下降了23.8%左右;相较于AdaBoost.MR算法,本文算法的Ranking Loss和One error降低30%左右,Coverage下降了15.6%左右。  相似文献   

6.
针对水声目标识别中常被忽略的数据不平衡问题,提出一种随机子空间AdaBoost算法(RSBoost)。通过随机子空间法在不同水声特征空间上提取子训练样本集,在各个子训练样本集上训练基分类器,将其中少类间隔均值最大的基分类器作为本轮选定的分类器,迭代形成最终集成分类器。在实测数据上进行试验,利用F-measure和G-mean两个准则对RSBoost算法和AdaBoost算法在不同特征集上的性能进行评价。试验结果表明:相对于AdaBoost算法, RSBoost算法在F-measure准则下的平均值由0.07提升到0.22,在G-mean准则下的平均值由0.18提升到0.25,说明在处理水声数据不平衡分类问题上, RSBoost算法优于AdaBoost算法。  相似文献   

7.
针对水声目标识别中常被忽略的数据不平衡问题,提出一种随机子空间AdaBoost算法(RSBoost)。通过随机子空间法在不同水声特征空间上提取子训练样本集,在各个子训练样本集上训练基分类器,将其中少类间隔均值最大的基分类器作为本轮选定的分类器,迭代形成最终集成分类器。在实测数据上进行试验,利用F-measure和G-mean两个准则对RSBoost算法和AdaBoost算法在不同特征集上的性能进行评价。试验结果表明:相对于AdaBoost算法, RSBoost算法在F-measure准则下的平均值由0.07提升到0.22,在G-mean准则下的平均值由0.18提升到0.25,说明在处理水声数据不平衡分类问题上, RSBoost算法优于AdaBoost算法。  相似文献   

8.
基于免疫抗体生成算法的电力变压器故障诊断   总被引:2,自引:0,他引:2  
提出了一种基于人工免疫的抗体生成算法,并将其应用于电力变压器的故障诊断。抗体生成算法仿生生物免疫系统中抗体对抗原的识别与记忆的机理,先对训练样本进行免疫学习和记忆,提取表征样本的有效特征,形成表征样本特征的记忆抗体集,再用最邻近分类法对测试样本进行分类识别。UCI的Iris数据集和电力变压器故障数据的仿真分析结果表明,抗体生成算法能够进行有效的分类,并具有很高的准确率。  相似文献   

9.
针对在不平衡的贫困学生数据中,传统的机器算法在分类时会偏向于多数类而忽略少数类,而导致少数特困类的分类准确率低的问题,提出了一种基于代价敏感的贫困生分类方法(CMPSC)。首先采取基于特征选择的预处理方法对低质量的贫困生数据进行处理;然后使用基于遗传算法的搜索方法确定贫困生数据的最优代价敏感矩阵;最后由经预处理的贫困生数据构建兼顾少数贫困类的代价敏感分类器,降低多数贫困类的影响。使用多个真实广西贫困生数据集进行对比实验,以CART算法为基准线,CMPSC方法平均总体分类准确率浮动值为0.66%,平均特困类分类准确率提升率为6.3%,最高提升率可达14.7%。本文方法可以在保持总体分类准确率的同时,有效提高少数特困类的分类准确率。  相似文献   

10.
针对电力变压器故障难以准确诊断的问题,提出了一种基于改进粒子群算法(PSO)的模糊神经网络(FNN)诊断模型。该模型运用模糊神经网络,同时结合变压器故障与变压器油中各气体成分之间的密切关系,确定了神经网络输入变量,同时在标准粒子群算法中引入遗传变异因子对模型进行训练,提高了训练精度。MATAB软件测试结果表明,模型预测精度较高,可进一步研究应用。  相似文献   

11.
将因子分析和基因表达式编程结合起来,对变压器油色谱数据进行处理和智能训练,并建立变压器故障分类诊断模型;收集到332组油色谱数据,选取150组作为GEP分类器的训练样本,182组作为测试样本,并将测试结果与三比值法和朴素贝叶斯分类器进行比较。大量诊断实例表明,所提出的变压器故障诊断模型性能优于另外两种方法。  相似文献   

12.
针对模糊c-harmonic均值算法(FCHM)在不平衡数据集上的聚类效果不理想的问题,提出了一种基于聚类体量约束的模糊c-harmonic均值算法。首先,利用隶属度矩阵定义各个类的体量,用于约束FCHM算法的代价函数,从而构建一个新的代价函数;然后,将该代价函数最小化,得到新的隶属度矩阵和聚类中心的计算公式;最后,在UCI数据集、模拟不平衡数据集及真实机床振动检测不平衡数据集上分别进行实验。实验结果表明,与同类算法相比,本文算法在保持传统算法全局最优性能的同时,在不平衡数据集上也能得到理想的聚类效果。  相似文献   

13.
为了解决变压器故障诊断过程中单分类器诊断精确度不足的问题,引入一种基于改进AdaBoost算法和二次映射支持向量描述的变压器故障诊断方法。该方法训练若干个多分类二次映射支持向量描述分类器,得到弱分类器,采用改进AdaBoost算法将这些弱分类器进行集成构成一个强分类器,并在迭代训练过程中通过改变训练样本的权重,使集成多分类模型聚焦于一些难以分类的样本,从而提高分类精度。实际案例分析表明所提方法能够提高变压器故障诊断精度  相似文献   

14.
针对电力变压器故障引起的被迫停机状况,推进符合运维需求的视情维修机制,利用隐马尔科夫模型对变压器剩余寿命进行了研究.收集系统相关运行状态和工况数据,利用退化信息及历史寿命数据基于隐马尔科夫模型对系统进行退化状态评价,得出状态转移矩阵以及观测概率矩阵.利用故障比率模型进行可靠度分析,得出变压器剩余寿命概率分布.结果表明,本文方法能大概率准确预测变压器剩余寿命.  相似文献   

15.
变压器油中溶解气体分析(DGA)是识别变压器的故障类型的一项重要技术,模糊聚类是一种有效的分析手段。但传统模糊聚类算法存在对随机初始化的聚类中心敏感、隶属度函数的有效度量范围较小使其容易陷入局部极值点的问题,因而实际分类效果不佳。针对传统FCM的不足,首先采用Canopy算法对DGA数据进行粗聚类,将其结果作为后续FCM聚类的初始聚类中心和最佳聚类数,降低了人为和随机初始化参数的主观性;然后通过引入负指数函数形式的相似度指标重构了FCM隶属度的迭代函数,降低了算法陷入局部极值点的可能性;最后通过对故障气体数据进行实例分析,验证了改进后的算法在识别变压器故障类别上的有效性和实用性。  相似文献   

16.
为了改善当前变压器故障诊断在特征量选取和使用单一诊断模型进行故障诊断上的不足,提高变压器故障诊断的准确率和效率,提出基于线性判别分析(LDA)的特征选取方法,建立基于分步机器学习的诊断模型. 该模型选取16组油中溶解气体体积分数比值的多特征参数,运用线性判别分析对参数进行降维作为输入特征向量;运用概率神经网络对变压器故障做出初步诊断,区分出易混淆故障;使用基于灰狼群算法优化的支持向量机对易混淆故障做进一步的区分. 最终实验诊断准确率为97.27%,诊断时间为4.87 s. 与单一机器学习模型相比,所提出的模型不仅具有更高的准确率,还具有更高的效率. 实例分析表明,本研究方法能有效弥补单一机器学习的缺陷,为故障样本有限情况下的电力变压器故障诊断提供参考.  相似文献   

17.
针对电力变压器故障引起的被迫停机状况,推进符合运维需求的视情维修机制,利用隐马尔科夫模型对变压器剩余寿命进行了研究.收集系统相关运行状态和工况数据,利用退化信息及历史寿命数据基于隐马尔科夫模型对系统进行退化状态评价,得出状态转移矩阵以及观测概率矩阵.利用故障比率模型进行可靠度分析,得出变压器剩余寿命概率分布.结果表明,本文方法能大概率准确预测变压器剩余寿命.  相似文献   

18.
为了实现代价敏感分类过程中的最小平均误分类代价的目的,本研究通过在分类过程中引入概率估计以及误分类代价重新构造分类结果,提出了基于极限学习机(extreme learning machine, ELM)的代价敏感算法CS ELM并在上述算法基础上,引入“拒识代价”,进一步减小了平均误分类代价。算法被运用到基因表达数据集上并与极限学习机、代价敏感决策树、代价敏感BP神经网络和代价敏感支持向量机做对比,可以得出,嵌入拒识的CS ELM算法能够更好地降低误分类代价,使分类结果更加可靠。  相似文献   

19.
电力变压器是电力企业的核心设备,充分预测电力变压器全寿命成本对于电力企业经济效益改善具有重要意义。基于电力设备全寿命周期成本标准框架,对83台110 kV电力变压器的历年数据进行处理,构造了含有变压器中标价格、变压器容量、空载损耗、负载损耗、硅钢材料成本、铜线成本、大修年故障频率、小修年故障频率及其对应的全寿命周期成本数据集。基于该数据集构建了灰狼算法(grey wolf algorithm, GWO)优化支持向量回归(support vector regression, SVR)的电力变压器全寿命周期成本预测模型,并对该模型进行了算例仿真,结果显示其在测试集中的平均相对误差仅为5.20%。此电力变压器模型为预测和评估电力变压器全寿命周期成本提供了一个新的方法。  相似文献   

20.
本文利用AdaBoost算法对K-means算法进行提升,提出了一种基于AdaBoost算法的K-means遥感影像分类方法.其中,针对数据集分布调整的具体实施问题,设计了一种有效的加权变值方法.实验结果表明,融合提升后的分类结果较基本K-means在孤立点的消除和细长目标的识别提取上效果更加显著.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号