排序方式: 共有10条查询结果,搜索用时 15 毫秒
1
1.
2.
ROC曲线是模型选择的一种重要方法,但ROC曲线的不确定性影响了模型选择的准确性.基于分辨粒度,从反映得分的不确定性的角度提出gROC和gAUC的概念,从理论上讨论了gROC的若干性质.在给出其算法之后,利用双正态模型检验了gROC的合理性.在此基础上,提出了两个模型选择度量--λAUC和ρAUC,并在UCI数据集上验证了该模型选择度量的高效性.实验结果表明,gROC能够有效反映ROC曲线的不确定性,基于λAUC和ρAUC的模型选择方法优于基于AUC或sAUC的模型选择方法,在某些情况下,gROC具有更强的对分类器性能的比较能力. 相似文献
3.
针对类不平衡或类分布偏斜数据分类器性能评估问题,提出了一种不平衡数据分类器的性能评估方法——加权AUC(wAUC),为区分不同类别上的正确率对总体性能的不同贡献,在计算ROC曲线下方面积的加权值时,根据真正率TPrate的取值,对不同区域采用不同的权值,使得评估度量更关注于正类准确度。讨论了权值函数应具有的性质,给出了wAUC的性质分析。理论分析和实验结果表明,加权AUC优于OP和AUC。 相似文献
4.
5.
提出一种XML文档分类算法——IL-AdaBoost。算法以XML频繁变化子结构为特征构建决策树桩,作为boosting算法的弱分类器,并改进了AdaBoost算法;利用泊松过程模拟新增XML文档的生成,反映XML文档随时间增加的特性,更新样本分布,实现增量学习。利用采样改善基本分类器的差异性,提高集成学习效果。 相似文献
6.
一种新的不平衡数据学习算法PCBoost 总被引:8,自引:0,他引:8
现实世界中广泛存在不平衡数据,其分类问题是机器学习研究中的一个热点.多数传统分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.文中提出一种不平衡数据分类算法-PCBoost.算法以信息增益率为分裂准则构建决策树,作为弱分类器.在每次迭代初始,利用数据合成方法添加合成的少数类样例,平衡训练信息;在子分类器形成后,修正“扰动”,删除未被正确分类的合成样例.文中讨论了数据合成方法,给出了训练误差界的理论分析,并分析了集成学习参数的选择.实验结果表明,PCBoost算法具有处理不平衡数据分类问题的优势. 相似文献
8.
聚类分析的目标是识别相似对象的组,有助于在大数据集合上发现模式的分布和有价值的相关性.由于在工程、商业和社会科学等许多应用领域都已经应用聚类分析,因此已经被广泛研究过.特别是近年来,已有的大量事务和实验数据集需要利用,数据挖掘的需求不断增长,这些都促进了聚类算法在不同领域的应用.本文介绍了聚类的基本概念,及聚类过程的重要问题-聚类结果的质量评估,同时介绍了采用外部准则对聚类结果进行评估的方法.由于对聚类结果的评估会导致计算复杂度过大的问题,因此用蒙特卡罗方法来降低计算复杂度. 相似文献
9.
讨论如何利用人工神经网络进行电力系统短期负荷预测。研究结果表明:基于BP神经网络的短期电力负荷预测具有精度高的特点,符合预测结果的相对误差小于3.06%。 相似文献
10.
Boosting是一种改善任意给定的学习算法性能的通用方法.主要关注AdaBoost算法,回顾了关于boosting的近期工作,包括AdaBoost训练误差和泛化误差的分析;boosting与博弈论及线性规划的联系;boosting与logistic 回归的关系;AdaBoost在多类分类问题的扩展. 相似文献
1