期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

董元方李雄飞李军《计算机工程》2010,36(24):161-163

针对不平衡数据学习问题,提出一种采用渐进学习方式的分类算法。根据属性值域分布,逐步添加合成少数类样例,并在阶段分类器出现误分时,及时删除被误分的合成样例。当数据达到预期的平衡程度时,用原始数据和合成数据训练学习算法,得到最终分类器。实验结果表明,该算法优于C4.5算法,并在多数数据集上优于SMOTEBoost和DataBoost-IM。相似文献

2.

基于分辨粒度的gROC曲线分析方法

董元方李雄飞李军赵海英《软件学报》2013,24(1):109-120

ROC曲线是模型选择的一种重要方法,但ROC曲线的不确定性影响了模型选择的准确性.基于分辨粒度,从反映得分的不确定性的角度提出gROC和gAUC的概念,从理论上讨论了gROC的若干性质.在给出其算法之后,利用双正态模型检验了gROC的合理性.在此基础上,提出了两个模型选择度量--λAUC和ρAUC,并在UCI数据集上验证了该模型选择度量的高效性.实验结果表明,gROC能够有效反映ROC曲线的不确定性,基于λAUC和ρAUC的模型选择方法优于基于AUC或sAUC的模型选择方法,在某些情况下,gROC具有更强的对分类器性能的比较能力. 相似文献

3.

一种新的分类器性能评估方法

李军李雄飞董元方赵海英《吉林大学学报(工学版)》2012,42(2):463-468

针对类不平衡或类分布偏斜数据分类器性能评估问题,提出了一种不平衡数据分类器的性能评估方法——加权AUC(wAUC),为区分不同类别上的正确率对总体性能的不同贡献,在计算ROC曲线下方面积的加权值时,根据真正率TPrate的取值,对不同区域采用不同的权值,使得评估度量更关注于正类准确度。讨论了权值函数应具有的性质,给出了wAUC的性质分析。理论分析和实验结果表明,加权AUC优于OP和AUC。相似文献

4.

一种新的决策表相对约简算法

下载免费PDF全文

董元方李雄飞李军屈成伟《计算机工程》2011,37(17):38-39,43

根据决策表定义条件属性区分能力指数DI(a)的概念,给出DI(a)的若干性质。定义拟等价类的概念,提出基于区分能力指数的决策表相对约简算法,该算法基于分治策略,用属性a代替相应区域的区分元素,从而减小算法搜索的空间。实验结果表明,该算法具有较高的搜索效率,能够得到全部或大部分约简。相似文献

5.

XML文档分类的IL-AdaBoost算法

董元方李雄飞李军李巍《吉林大学学报(工学版)》2011,(4):1054-1058

提出一种XML文档分类算法——IL-AdaBoost。算法以XML频繁变化子结构为特征构建决策树桩,作为boosting算法的弱分类器,并改进了AdaBoost算法;利用泊松过程模拟新增XML文档的生成,反映XML文档随时间增加的特性,更新样本分布,实现增量学习。利用采样改善基本分类器的差异性,提高集成学习效果。相似文献

6.

一种新的不平衡数据学习算法PCBoost 总被引：8，自引：0，他引：8

李雄飞李军董元方屈成伟《计算机学报》2012,35(2):2202-2209

现实世界中广泛存在不平衡数据,其分类问题是机器学习研究中的一个热点.多数传统分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.文中提出一种不平衡数据分类算法-PCBoost.算法以信息增益率为分裂准则构建决策树,作为弱分类器.在每次迭代初始,利用数据合成方法添加合成的少数类样例,平衡训练信息;在子分类器形成后,修正“扰动”,删除未被正确分类的合成样例.文中讨论了数据合成方法,给出了训练误差界的理论分析,并分析了集成学习参数的选择.实验结果表明,PCBoost算法具有处理不平衡数据分类问题的优势. 相似文献

7.

基于深度学习的图像补全算法综述

唐浩丰董元方张依桐孙娟娟《计算机科学》2020,47(z2):151-164

相似文献

8.

用蒙特卡罗方法实现聚类结果评估

董元方李军《长春理工大学学报(自然科学版)》2008,31(1):77-80

聚类分析的目标是识别相似对象的组,有助于在大数据集合上发现模式的分布和有价值的相关性.由于在工程、商业和社会科学等许多应用领域都已经应用聚类分析,因此已经被广泛研究过.特别是近年来,已有的大量事务和实验数据集需要利用,数据挖掘的需求不断增长,这些都促进了聚类算法在不同领域的应用.本文介绍了聚类的基本概念,及聚类过程的重要问题-聚类结果的质量评估,同时介绍了采用外部准则对聚类结果进行评估的方法.由于对聚类结果的评估会导致计算复杂度过大的问题,因此用蒙特卡罗方法来降低计算复杂度. 相似文献

9.

基于BP神经网络数学模型的短期负荷预测研究

马继涛李军董元方艾欣《长春理工大学学报(自然科学版)》2007,30(2):111-114,108

讨论如何利用人工神经网络进行电力系统短期负荷预测。研究结果表明:基于BP神经网络的短期电力负荷预测具有精度高的特点,符合预测结果的相对误差小于3.06%。相似文献

10.

Boosting算法的理论分析及其应用

董元方李军《长春理工大学学报(自然科学版)》2009,32(2):344-347

Boosting是一种改善任意给定的学习算法性能的通用方法.主要关注AdaBoost算法,回顾了关于boosting的近期工作,包括AdaBoost训练误差和泛化误差的分析;boosting与博弈论及线性规划的联系;boosting与logistic 回归的关系;AdaBoost在多类分类问题的扩展. 相似文献