共查询到20条相似文献,搜索用时 62 毫秒
1.
集成学习主要通过扰动训练数据集来产生较强泛化能力.研究者们提出了各种各样的方法来实现这一目标,但如何扰动训练数据集以达到最佳的泛化能力并没有被深入研究.本文中,提出了对训练数据集进行扰动的交叉分组(cross-grouping)方法,通过改变交叉因子以实现对训练数据集不同程度的扰动,从而实现当集成规模较小时,得到更强的泛化能力.实验表明,当选择合适的交叉因子时,GG-Bagging泛化能力要强于Bagging和Boosting,略优于Decorate和Random Forests. 相似文献
2.
付忠良 《计算机研究与发展》2013,50(4):861-872
集成学习算法的构造属于机器学习领域的重要研究内容,尽管弱学习定理指出了弱学习算法与强学习算法是等价的,但如何构造好的集成学习算法仍然是一个未得到很好解决的问题.Freund和Schapire提出的AdaBoost算法和Schapire和Singer提出的连续AdaBoost算法部分解决了该问题.提出了一种学习错误定义,以这种学习错误最小化为目标,提出了一种通用的集成学习算法,算法可以解决目前绝大多数分类需求的学习问题,如多分类、代价敏感分类、不平衡分类、多标签分类、模糊分类等问题,算法还对AdaBoost系列算法进行了统一和推广.从保证组合预测函数的泛化能力出发,提出了算法中的简单预测函数可统一基于样本的单个特征来构造.理论分析和实验结论均表明,提出的系列算法的学习错误可以任意小,同时又不用担心出现过学习现象. 相似文献
3.
4.
针对AdaBoost。M2算法在解决多类不平衡协议流量的分类问题时存在不足,提出一种适用于因特网协议流量多类不平衡分类的集成学习算法RBWS-ADAM2,本算法在AdaBoost。M2每次迭代过程中,设计了基于权重的随机平衡重采样策略对训练数据进行预处理,该策略利用随机设置采样平衡点的重采样方式来更改多数类和少数类的样本数目占比,以构建多个具有差异性的训练集,并将样本权重作为样本筛选的依据,尽可能保留高权重样本,以加强对此类样本的学习。在国际公开的协议流量数据集上将RBWS-ADAM2算法与其他类似算法进行实验比较表明,相比于其他算法,该算法不仅对部分少数类的F-measure有较大提升,更有效提高了集成分类器的总体G-mean和总体平均F-measure,明显增强了集成分类器的整体性能。 相似文献
5.
6.
舌诊是中医传统诊断的一个重要方式.本文以模式识别、图像处理和中医舌诊理论为研究基础,结合中医诊断规则,提出舌象的分区训练识别方法,并采用一种新的基于集成学习的AdaBoost算法,构建出一套完整的、符合中医诊断体系规范的舌象分类识别算法.通过实验验证,该方法对中医舌诊分类识别是有效的. 相似文献
7.
在Ad Hoc网络中,广播有着相当广泛的应用,其算法的效率极大地影响着网络的性能.本文基于DP算法提出了BN-DP算法,考虑了节点分布、计数器值以及收发节点间距离对广播算法的影响,赋予处于接收边缘的节点更高的转发概率.然后使用概率模型检测工具PRISM,分析了计数器值和节点分布对BN-DP算法性能的影响.结果表明:在相同可达率的情况下,所提出的BN-DP算法与FP、DP算法相比,减少了转发分组的数量,提高了广播效率. 相似文献
8.
一些文献认为Hughes-Hartogs比特分配算法在向多个子载波分配比特时,运算复杂度太大、速度太慢,实时性差.鲜有文献对它的运算量进行具体的分析.文中对Hughes-Hartogs比特分配算法的运算量进行了理论分析,得出了衡量它的运算量的方法.并在有线信道双绞线模型下,通过Matlab仿真,从发送总比特数和运算量两个方面,比较了Hughes-Hartogs算法与最优化的贪心算法的性能,得出了可用发送功率和量化间隔对Hughes-Hartogs算法性能的影响,以及怎样选择合适的参数既使Hughes-Hartogs算法的运算复杂度尽量小又使发送总比特数尽量大.并提出算法的改进方案,可以看到改进后的算法能够满足实时应用的需求. 相似文献
9.
针对目前方面词情感分析方法忽视了以方面词为核心的局部特征的重要性,并难以有效减小情感干扰项的负面噪声的问题,本文提出了一种带有基于变换器的双向编码器表示技术(bi-directional encoder representations from transformers,BERT)加持的双特征嵌套注意力模型(dual features attention-over-attention with BERT,DFAOA-BERT),首次将AOA(attention-over-attention)与BERT预训练模型结合,并设计了全局与局部特征提取器,能够充分捕捉方面词和语境的有效语义关联。实验结果表明:DFAOA-BERT在SemEval 2014任务4中的餐馆评论、笔记本评论和ACL-14 Twitter社交评论这3个公开数据集上均表现优异,而子模块的有效性实验,也充分证明了DFAOA-BERT各个部分的设计合理性。 相似文献
10.
PrefixSpan算法与CloSpan算法的分析与研究 总被引:1,自引:0,他引:1
数据挖掘领域的一个活跃分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列.介绍序列模式挖掘的基本概念,然后对序列模式中的经典算法PrefixSpan算法和基于PrefixSpan框架的闭合序列模式CloSpan算法进行了描述,并对它们的执行过程及其特点进行了分析与比较,总结了各自的优缺点,指出PrefixSpan算法适用于短序列方面挖掘,而CloSpan算法在长序列或者阈值较低时胜过PrefixSpan算法且CloSpan算法挖掘大型的数据库有更好的性能,得出的结果对序列模式挖掘的设计有重要的参考价值. 相似文献
11.
李锶 《计算技术与自动化》2007,26(1):74-76
讨论ZT-FDTD算法,针对其中的不足,提出使用基于Z变换的(FD)2TD算法计算色散半空间上三维有限长介质柱的宽带电磁散射特性.针对在不同极化及入射角情况下的宽带散射,运用(FD)2TD算法进行分析,将频域方程变换到Z域,再返回到时域进行差分计算,并给出仿真结果. 相似文献
12.
13.
14.
一、概述心电向量图(简称VCG)是在人体表面检测心电活动信号而构成的一种图形,是一种二维的正交心电图.对VCG检查已成为一种心脏的常规辅助诊断手段.由于VCG数据人工测量较麻烦,有些参数,如各瞬间向量、面积等甚至不能用人工方法获得.为此研制了VCG自动分析诊断系统VCG-CARD,它是一个实时的自动系统.主要硬件包括日本VA3G型向量图仪、VCG接口电路和IBM-PC.设计中充分利用了VA3G内部的6K字节存贮器,将这6K字节心电信号通过接口电路转存到PC指定内存区,节省了A/D变换的软硬件开销. 本文着重阐述该系统的图形分析识别算法.有关诊断模型方面问题见文献[1]. 相似文献
15.
16.
由最小长度加法生成序列定义出发,结合树型结构的特点,探索其解决方案。并用Delphi语言实现了该算法。 相似文献
17.
18.
基于MapInfo的线面拓扑分析算与实现 总被引:2,自引:0,他引:2
由于不具备拓扑关系的数据结构,MapInfo的拓扑分析能力受到限制。为了进行线断面拓扑关系判断,通过算法分析提出了两种高效的建立拓扑关系的方案,并加以实现。 相似文献
19.
20.
Fuzzy ISODATA聚类分析方法的设计 总被引:2,自引:0,他引:2
文章探讨了模糊ISODATA方法的基本思想、基本原理和实现的具体步骤,设计了可行ISODATA算法,对模糊ISODATA方法的参数m、分类数c、初始分类矩阵U^(0)和ε的取值对最优软划分矩阵的影响分析,对ISODATA算法的改进,使之理论上更加严谨,在应用时分类更加准确。 相似文献