首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
针对最小化错误分类器不一定满足最小化误分类代价的问题,提出了一种代价敏感准则--即最小化误分类代价和最小化错误分类率的双重准则.研究了基于代价敏感准则的贝叶斯网络结构学习,要求搜索网络结构时在满足误分类代价最小的同时,还要满足错误分类率优于当前的最优模型.在UCI数据集上学习代价敏感贝叶斯网络,并与相应的生成贝叶斯网络和判别贝叶斯网络进行比较,结果表明了代价敏感贝叶斯网络的有效性.  相似文献   

2.
随着电子商务领域的迅速发展,在线商品评价规模日益庞大,评价质量参差不齐,用户难以筛选有用评价信息做出购买决策,因此如何有效识别高质量评价信息成为重要议题。以在线商品评价的有用性投票为基础定义评价质量,使用贝叶斯网络表示在线商品评价的相似性及不确定性,通过对在线商品评价信息进行多维度特征统计,构建在线商品评价质量评估模型,使用概率推理机制对在线商品评价质量进行分类预测,并给出评价质量分类置信度。在真实数据集上验证模型有效性及高效性。  相似文献   

3.
一般的学习算法通过最小化分类损失使分类错误率最小化,而代价敏感学习则以最小化分类代价为目标,需构造代价敏感损失.本文探讨代价敏感损失的设计准则,首先介绍基于代价敏感风险优化的代价敏感学习方法,然后在Bayes最优分类理论框架下,提出两条代价敏感损失设计准则.接着采用两种常用代价敏感损失生成方法构造平方损失、指数损失、对数损失、支持向量机损失等经典损失函数的代价敏感扩展形式.根据所提出的设计准则,从理论上分析这些代价敏感损失的性能.最后通过实验表明,同时满足两条设计准则的代价敏感损失能有效降低分类代价,从而证明了本文提出的代价敏感损失设计准则的合理性.  相似文献   

4.
阮晓宏  黄小猛  袁鼎荣  段巧灵 《计算机科学》2013,40(Z11):140-142,146
代价敏感学习方法常常假设不同类型的代价能够被转换成统一单位的同种代价,显然构建适当的代价敏感属性选择因子是个挑战。设计了一种新的异构代价敏感决策树分类器算法,该算法充分考虑了不同代价在分裂属性选择中的作用,构建了一种基于异构代价的分裂属性选择模型,设计了基于代价敏感的剪枝标准。实验结果表明,该方法处理代价机制和属性信息的异质性比现有方法更有效。  相似文献   

5.
一种新的代价敏感分类方法   总被引:1,自引:0,他引:1  
代价敏感学习(cost-sensitive learning)是指在机器学习的过程中考虑不同的误判(misclassification)带来的不同的代价(cost).论文将一项最新的贝叶斯分类研究成果应用到代价敏感学习中,提出了一种新的称之为代价敏感隐藏朴素贝叶斯分类算法.实验表明该方法比另一种典型的代价敏感算法更有效.  相似文献   

6.
郭冰楠  吴广潮 《计算机应用》2019,39(10):2888-2892
在网络贷款用户数据集中,贷款成功和贷款失败的用户数量存在着严重的不平衡,传统的机器学习算法在解决该类问题时注重整体分类正确率,导致贷款成功用户的预测精度较低。针对此问题,在代价敏感决策树敏感函数的计算中加入类分布,以减弱正负样本数量对误分类代价的影响,构建改进的代价敏感决策树;以该决策树作为基分类器并以分类准确度作为衡量标准选择表现较好的基分类器,将它们与最后阶段生成的分类器集成得到最终的分类器。实验结果表明,与已有的常用于解决此类问题的算法(如MetaCost算法、代价敏感决策树、AdaCost算法等)相比,改进的代价敏感决策树对网络贷款用户分类可以降低总体的误分类错误率,具有更强的泛化能力。  相似文献   

7.
基于相对等待时间的代价敏感决策树   总被引:1,自引:0,他引:1       下载免费PDF全文
首先引入相对等待时间代价,将它与测试代价一起称为有形代价,利用单位有形代价中无形代价(即误分类代价)降低最多的原则选择分裂属性;然后结合序列测试策略和批量测试策略建立相对等待时间代价敏感决策树。实验结果显示,该方法无论在误分类代价的减少量上还是所需有形代价的数量上都优于存在的算法,并且实验地分析了建立代价敏感决策树考虑相对等待时间是必要的。  相似文献   

8.
相关向量机(RVM)是在稀疏贝叶斯框架下提出的稀疏模型,由于其强大的稀疏性和泛化能力,近年来在机器学习领域得到了广泛研究和应用,但和传统的决策树、神经网络算法及支持向量机一样,RVM不具有代价敏感性,不能直接用于代价敏感学习。针对监督学习中错误分类带来的代价问题,提出代价敏感相关向量分类(CS-RVC)算法,在相关向量机的基础上,通过赋予每类样本不同的误分代价,使其更加注重误分类代价较高的样本分类准确率,使得整体误分类代价降低以实现代价敏感挖掘。实验结果表明,该算法具有良好的稀疏性并能够有效地解决代价敏感分类问题。  相似文献   

9.
万建武  杨明 《软件学报》2020,31(1):113-136
分类是机器学习的重要任务之一.传统的分类学习算法追求最低的分类错误率,假设不同类型的错误分类具有相等的损失.然而,在诸如人脸识别门禁系统、软件缺陷预测、多标记学习等应用领域中,不同类型的错误分类所导致的损失差异较大.这要求学习算法对可能导致高错分损失的样本加以重点关注,使得学习模型的整体错分损失最小.为解决该问题,代价敏感学习方法引起了研究者的极大关注.以代价敏感学习方法的理论基础作为切入点,系统阐述了代价敏感学习的主要模型方法以及代表性的应用领域.最后,讨论并展望了未来可能的研究趋势.  相似文献   

10.
信息时代的到来,数据作为信息的载体其重要性也愈加突出,随着人们对不确定数据研究的深入,代价敏感数据挖掘技术被应用于不确定数据挖掘中。本文介绍了不确定数据,分析了现有不确定数据挖掘方法,在介绍代价敏感学习的基础上,介绍了一种针对不确定数据的代价敏感决策树算法,并通过实验验证了这一算法的合理可行。  相似文献   

11.
田翔 《微计算机信息》2007,23(27):253-254,77
作为一种知识推理和进行概率推理的框架,贝叶斯网络在具有内在不确定性和决策问题中得到了广泛的应用。因果推理是态势评估中的一个重要环节,用贝叶斯网找出态势假设和事件之间的潜在关系,正是态势评估所需完成的功能。根据态势与实践之间不同的连接关系建立了态势评估的贝叶斯网络模型,并分别介绍了相应的信息传播算法,最后一个实例来说明该网络的计算过程。  相似文献   

12.
针对最优贝叶斯网络分解是一个NP-完全问题,提出了一种基于混合遗传贝叶斯网络分解算法PHGA.PHGA算法将进化过程划分为三个不同的阶段,在前期和中期阶段采用较大的种群规模和交叉率,以及较小的群体选择压力,来增强PHGA算法的全局探索能力,避免早熟现象;在后期采用较小的种群规模和交叉率,以及较大的群体选择压力,并引入爬山局部优化算子,以增强群体在进化后期中的局部寻优能力,提高算法的收敛速度.三个标准的贝叶斯网络上的实验表明该算法在最优解方面要优于遗传算法和模拟退火算法.  相似文献   

13.
程恺  车先明  张宏军  智军  张睿 《计算机工程》2011,37(1):10-12,15
针对部队作战不确定因素多、建模复杂的特点,提出一种作战行动效能的评估模型。运用粗糙集理论除去冗余的评估指标,降低朴素贝叶斯分类器的时空复杂度。给出该模型的评估算法步骤,通过贝叶斯网络的参数学习,将不同数据类型的评估指标统一在类条件概率分布中,既保证了评估的客观性,又较好地表达出作战过程随机性的特点。实例研究表明,将该方法用于作战行动效能的评估是可行的。  相似文献   

14.
基于贝叶斯网络的入侵容忍系统   总被引:2,自引:0,他引:2  
提出一种基于贝叶斯网络的入侵容忍系统,给出系统的运行流程.用进程特性向量来表示一个具体的进程,并对进程特性进行具体的分类.提出利用贝叶斯网络模型来描述进程的运行过程,给出基于贝叶斯网络推理的进程类型概率值的计算公式,构造了用于确定进程危险程度的危险函数,并用实例说明了对入侵进程的具体识别过程.  相似文献   

15.
基于贝叶斯网络的计划评审技术   总被引:1,自引:0,他引:1  
进度、质量是软件项目管理的重要内容,计划评审技术(PERT)在安排软件项目进度计划时仅考虑了时间因素,质量作为衡量项目成功的重要因素,在进度安排过程中没有涉及到。为了在进度安排过程中考虑到质量因素的影响,本文章提出了基于贝叶斯网络的计划评审技术,并且将其应用于实际的开发过程中,取得了很好的效果。  相似文献   

16.
提出了决策表系统的基于广义决策函数(GDF)与基于贝叶斯网的分解方法是等价的;指出决策表系统的分解问题可归结为求解与决策表系统相应的多模块贝叶斯网(MSBN)及其d-割集;对同一个贝叶斯网(BN)具有不同的d-割集,存在不同的分解模式,提出并证明了MSBN的d-割集和连接联合森林(LJF)的割集之间的关系,而且LJF的割集决定着MSBN优化的d-割集,这样决策表系统分解问题也就是求解LJF的割集;最后通过案例说明提出的方法的可行性.  相似文献   

17.
随着大数据时代的到来,恶意URL作为Web攻击的媒介渐渐威胁着用户的信息安全。传统的恶意URL检测手段如黑名单检测、签名匹配方法正逐步暴露缺陷,为此本文提出一种基于代价敏感学习策略的恶意URL检测模型。为提高卷积神经网络在恶意网页检测领域的性能,本文提出将URL数据结合HTTP请求信息作为原始数据样本进行特征提取,解决了单纯URL数据过于简单而造成特征提取困难的问题,通过实验对比了三种编码处理方式,根据实验结果选取了最佳字符编码的处理方式,保证了后续检测模型的效果。同时本文针对URL字符输入的特点,设计了适合URL检测的卷积神经网络模型,为了提取数据深层特征,使用了两层卷积层进行特征提取,其次本文在池化层选择使用BiLSTM算法提取数据的时序特征,同时将该网络的最后一个单元输出达到池化效果,避免了大量的模型计算,保证了模型的检测效率。同时为解决数据样本不均衡问题,在迭代过程中为其分配不同惩罚因子,改进了数据样本初始化权重的分配规则并进行了归一化处理,增加恶意样本在整体误差函数中的比重。实验结果表明本文模型在准确率、召回率以及检测效率上较优于其他主流检测模型,并对于不均衡数据集具有较好的抵抗能力。  相似文献   

18.
基于贝叶斯网络的数据挖掘方法   总被引:6,自引:0,他引:6  
李艳美  张卓奎 《计算机仿真》2008,25(2):87-89,161
常用的数据挖掘方法有许多,贝叶斯网络(Bayesian Networks,BN)方法在数据挖掘中的应用是当前研究的热点问题.贝叶斯网络是一种进行不确定性推理和知识表示的有力工具,当与统计方法结合使用时,显示出许多关于数据处理的优势.首先介绍了BN的定义、方法的优点以及目前网络学习的各种算法,最后用一个实际中的案例进行试验,指出了在数据挖掘技术中的具体应用.得到了将贝叶斯网络应用于数据挖掘当中,充分挖掘数据的隐含信息和内在本质,具备良好地预测能力等优点,实验证明这种方法实用、有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号