共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
将决策粗糙集与代价敏感学习相结合,提出了一种基于决策粗糙集的代价敏感分类方法。依据决策粗糙集理论和属性约简方法,对待预测样本分别计算最优测试属性集,使得样本在最优测试属性集上计算的分类结果具有最小误分类代价和测试代价,依此给出样本的最小总代价分类结果。针对全局最优测试属性集求解过程中计算复杂度高的问题,提出了局部最优测试属性集的启发式搜索算法。该算法以单个属性对降低总分类代价的贡献率为启发函数,搜索各样本的局部最优测试属性集,并输出在局部最优测试属性集上样本的代价敏感分类结果。在UCI数据上的实验分析显示,所提算法有效地降低了分类结果的总代价和测试属性个数,使得样本分类结果同时具有较小的误分类代价和较小的测试代价。 相似文献
5.
代价敏感属性选择问题的目的是通过权衡测试代价和误分类代价,得到一个具有最小总代价的属性子集。目前,多数代价敏感属性选择方法只考虑误分类代价固定不变的情况,不能较好地解决类分布不均衡等问题。而在大规模数据集上,算法效率不理想也是代价敏感属性选择的主要问题之一。针对这些问题,以总代价最小为目标,设计了一种新的动态误分类代价机制。结合分治思想,根据数据集规模按列自适应拆分各数据集。基于动态误分类代价重新定义最小代价属性选择问题,提出了动态误分类代价下的代价敏感属性选择分治算法。通过实验表明,该算法能在提高效率的同时获得最优误分类代价,从而保证所得属性子集的总代价最小。 相似文献
6.
相关向量机(RVM)是在稀疏贝叶斯框架下提出的稀疏模型,由于其强大的稀疏性和泛化能力,近年来在机器学习领域得到了广泛研究和应用,但和传统的决策树、神经网络算法及支持向量机一样,RVM不具有代价敏感性,不能直接用于代价敏感学习。针对监督学习中错误分类带来的代价问题,提出代价敏感相关向量分类(CS-RVC)算法,在相关向量机的基础上,通过赋予每类样本不同的误分代价,使其更加注重误分类代价较高的样本分类准确率,使得整体误分类代价降低以实现代价敏感挖掘。实验结果表明,该算法具有良好的稀疏性并能够有效地解决代价敏感分类问题。 相似文献
7.
代价敏感决策树是以最小化误分类代价和测试代价为目标的一种决策树.目前,随着数据量急剧增长,劣质数据的出现也愈发频繁.在建立代价敏感决策树时,训练数据集中的劣质数据会对分裂属性的选择和决策树结点的划分造成一定的影响.因此在进行分类任务前,需要提前对数据进行劣质数据清洗.然而在实际应用中,由于数据清洗工作所需要的时间和金钱代价往往很高,许多用户给出了自己可接受的数据清洗代价最大值,并要求将数据清洗的代价控制在这一阈值内.因此除了误分类代价和测试代价以外,劣质数据的清洗代价也是代价敏感决策树建立过程中的一个重要因素.然而,现有代价敏感决策树建立的相关研究没有考虑数据质量问题.为了弥补这一空缺,着眼于研究劣质数据上代价敏感决策树的建立问题.针对该问题,提出了3种融合数据清洗算法的代价敏感决策树建立方法,并通过实验证明了所提出方法的有效性. 相似文献
8.
9.
10.
11.
《计算机科学与探索》2018,(5):839-850
决策粗糙集和多粒度粗糙集是两种重要的数据处理机制。在对多重代价决策粗糙集模型和多粒度粗糙集模型的研究基础上,通过综合考虑多重代价矩阵和多粒度思想,将权重均值代价策略引入决策粗糙集模型中,提出了一种基于权重多重代价的多粒度决策粗糙集模型。在不完备信息系统中,分析了悲观代价决策粗糙集、乐观代价决策粗糙集和权重多重代价多粒度决策粗糙集模型,并给出了以上各种模型的决策代价总代价计算公式。以权重多重代价悲观多粒度决策粗糙集模型为例,讨论了该模型下随着粒度的变化其正域的变化情况,并给出了一种基于代价最小化的粒度约简方法。该模型更好地结合了决策粗糙集模型和多粒度粗糙集模型,可从多角度分析解决决策粗糙集模型中的相关问题。 相似文献
13.
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。 相似文献
14.
安全和可靠是数据库系统两个重要的可信指标,它们的策略配置与系统的高效运行是有冲突的.本文分析了安全、可靠等可信指标及其相关测试工具,提出了可信赖性能基准程序性能测试特点,以指导用户制定、评价、选择数据库安全可靠策略的实施.最后介绍了基于TPC性能基准改进的数据库系统安全代价测试工具功能及其实施方法. 相似文献
15.
在数据库操作中查询操作所占比重最大,而查询操作又是代价最大的语句。在数据查询操作过程中,每种类型的操作发生的代价各不相同。本文结合实例,提出对查询过程中的诸如投影、选择、连接、分组与聚集等操作代价的估算方法。 相似文献
16.
面向对象数据库中查询代价的估算 总被引:4,自引:0,他引:4
好的查询优化器都是基于代价的,因此查询代价的估算是数据库查询优化中一项不可缺少的工作。文中在联系代数的基础上,综合考虑了对象聚集,索引等因素,给出了面向对象数据库中查询代价的一种估算方法。 相似文献
17.
提出了一种应用整体可靠性和补偿代价敏感的Web服务选取方法.该方法基于应用的逻辑特性来评估应用的交互点对于应用整体可靠性和补偿代价的影响,并获取相应的影响因子.在此基础上,结合反映用户偏好的服务质量向量的规约完成Web服务的选取.分析及实验结果表明,该方法从服务使用者和应用系统两个角度出发,在保证服务使用者偏好的基础上,可弥补现有方法在保证应用整体可靠性和降低系统补偿代价方面的欠缺. 相似文献
18.
主要研究了资源分配基数,提出了一种新的基于选择消费代价网格资源分配算法。提出的方法首先采用模糊基数建立一个消费代价函数模型,给出了网络中带权值的多参数消费代价函数。实例验证表明,当用户需要从系统中获得资源时,采用该方法在网格规模非常大而且计算量较小的情况下,选择代价最小的方法给用户使用来分配资源,具有一定的实际应用价值。 相似文献
19.
针对最小化错误分类器不一定满足最小化误分类代价的问题,提出了一种代价敏感准则--即最小化误分类代价和最小化错误分类率的双重准则.研究了基于代价敏感准则的贝叶斯网络结构学习,要求搜索网络结构时在满足误分类代价最小的同时,还要满足错误分类率优于当前的最优模型.在UCI数据集上学习代价敏感贝叶斯网络,并与相应的生成贝叶斯网络和判别贝叶斯网络进行比较,结果表明了代价敏感贝叶斯网络的有效性. 相似文献
20.
代价敏感概率神经网络及其在故障诊断中的应用 总被引:3,自引:1,他引:2
针对传统的分类算法人多以误分率最小化为目标,忽略了误分类型之间的差别和数据集的非平衡性的问题,提出代价敏感概率神经网络算法.该算法将代价敏感机制引入概率神经网络,用期望代价取代误分率,以期望代价最小化为目标,基于期望代价最小的贝叶斯决策规则预测新样本类别.采用工业现场数据和数据集German Credit验证了该算法的有效性.实验结果表明,该算法具有故障识别率高、泛化能力强、建模时间短等特点. 相似文献