首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
胡正平  路亮  许成谦 《电子学报》2012,40(1):134-140
 已有单类分类算法通常采用欧氏测度描述样本间相似关系,然而欧氏测度有时难以较好地反映一些数据集样本的内在分布结构,为此提出一种用于改善单类分类器描述性能的高维空间单类数据距离测度学习算法,与已有距离测度学习算法相比,该算法只需提供目标类数据,通过引入样本先验分布正则化项和L1范数惩罚的距离测度稀疏性约束,能有效解决高维空间小样本情况下的单类数据距离测度学习问题,并通过采用分块协调下降算法高效的解决距离测度学习的优化问题.学习得到的距离测度能容易地嵌入到单类分类器中,仿真实验结果表明采用学习得到的距离测度能有效改善单类分类器的描述性能,特别能够改善覆盖分类的描述能力,从而使得单类分类器具有更强的推广能力.  相似文献   

2.
由于计算机内存资源限制,分类器组合的有效性及最优性选择是机器学习领域的主要研究内容。经典的集成分类算法在处理小数据集时,拥有较高的分类准确性,但面对大量数据时,由于多基分类器学习、分类共用1台计算机资源,导致运算效率较低,这显然不适合处理当今的海量数据。针对已有集成分类算法只适合作用于小规模数据集的缺点,剖析了集成分类器的特性,采用基于聚合方式的集成分类器和云计算的MapReduce技术设计了并行集成分类算法(EMapReduce),达到并行处理大规模数据的目的。并在Amazon计算集群上模拟实验,实验结果表明该算法具有一定的高效性和可行性。  相似文献   

3.
越来越多的研究表明,借助量子计算技术可以提高有监督分类算法和无监督聚类算法的计算效率,甚至是学习精度.通常采用的方法有:基于量子理论将经典信息转换为量子态的形式存储起来,用量子态来表示所有样本;以量子态之间的距离替代样本数据之间的经典距离,形成新的相似度来度量样本数据间的相似性等.通过理论和模拟验证表明,量子计算可以实现对经典机器学习算法的加速.最后,总结了量子机器学习技术的优势和目前所存在的问题,并展望了未来该领域的发展趋势.  相似文献   

4.
朴素贝叶斯分类算法由于其计算高效在生活中应用广泛。本文根据集成算法的差异性特征,聚类算法聚类点的选择方式的可变性,提出了基于K-medoids聚类技术的贝叶斯集成算法,朴素贝叶斯的泛化性能得到了提升。首先,通过样本集训练出多个朴素贝叶斯基分类器模型;然后,为了增大基分类器之间的差异性,利用K-medoids算法对基分类器在验证集上的预测结果进行聚类;最后,从每个聚类簇中选择泛化性能最佳的基分类器进行集成学习,最终结果由简单投票法得出。将该算法应用于UCI数据集,并与其他类似算法进行比较可得,本文提出的基于K-medoids聚类的贝叶斯集成算法(NBKME)提高了数据集的分类准确率。  相似文献   

5.
基于集成学习提出了一种新的模糊分类规则的产生算法。将分类规则的前件、后件模糊化,在自适应提升(Adaptive Boosting,AdaBoost)算法的迭代中,调整训练实例的分布,利用遗传算法产生模糊分类规则。并在规则学习的适应度函数中引入训练实例的分布,使得模糊分类规则在产生阶段就考虑相互之间的协作,产生具有互补性的分类规则集。从而改善了模糊分类规则的整体识别能力,提高了分类识别精度。  相似文献   

6.
全极化合成孔径雷达(PolSAR)图像蕴含更丰富的散射信息,具有更多的可用特征。如何使用这些特征是极化SAR图像分类中非常重要的一步,但是目前尚未对此提出非常明确的准则。为了能够有效地解决上述问题,该文提出一种基于特征加权集成的极化SAR图像分类算法。该算法采用0-1矩阵分解集成方法对包括不同特征的数据集进行学习获得相应加权系数,并通过对每个特征集获得的预测结果进行加权集成来提高极化SAR图像分类性能。首先,输入极化SAR数据,获得极化特征作为原始特征集,并对其进行随机抽取获得不同的特征子集;然后,使用0-1矩阵集成算法得到每个特征值相对应的加权系数;最后,通过对各个特征子集的预测结果进行集成得到最终极化SAR图像分类结果。实测L波段和C波段极化数据的实验结果表明,该算法可以有效地提高极化SAR图像分类的准确度。  相似文献   

7.
基于信息熵差异性度量的数据流增量集成分类算法   总被引:2,自引:0,他引:2  
琚春华  邹江波 《电信科学》2015,31(2):92-102
对分类器之间的差异性进行了研究,提出了一种基于信息熵差异性度量的增量集成分类算法,将信息熵差异性度量方法融入到基分类器选择过程中,通过对训练数据集的基分类结果的信息熵差异度计算,采用循环迭代优化的选择方法,以熵差异性最优化为约束目标,动态调整基分类器个数,实现了分类准确稳定,减少了系统开销。通过实验比对,证明了算法在数据流处理时比其他算法具有更小的开销和较强的适应性。  相似文献   

8.
非平衡样本分类的集成迁移学习算法   总被引:2,自引:0,他引:2       下载免费PDF全文
于重重  田蕊  谭励  涂序彦 《电子学报》2012,40(7):1358-1363
针对冗余数据量大且正负样本不平衡的辅助训练数据,提出了一种改进集成迁移学习算法,利用这些辅助训练数据迁移帮助目标数据进行分类.新的样本初始权重分配及调整策略,突出了对负样本的识别能力.通过动态调整辅助训练集,根据设定好的权重阈值下限适时地淘汰冗余数据,降低了冗余数据对分类器性能的影响,提升了迁移学习对非平衡样本的学习能力.本文利用桥梁实际监测数据进行的实验表明了该算法较TrAdaboost算法的有效性.  相似文献   

9.
在海量网页中进行自动的主题识别是网页信息分析挖掘的重要研究方向,具有重要的理论和应用意义。提出一种基于集成学习的网页主题识别算法框架,由异质网页属性集构建不同的最大间隔分类器,使用集成学习对基分类器的信息进行融合。在基准数据集上进行测试,其结果表明该算法对网页主题识别是有效的。  相似文献   

10.
分类预测是机器学习的基础任务,在机器视觉、文本分析、在线广告等领域均有广泛的应用,对行业发展具有极大的促进作用。随着信息技术的发展,数据规模不断扩大,复杂的高维数据使得传统的分析方法变得困难,以至于现有的深度学习模型在对复杂数据集进行分类预测时,常常出现预测性能不够理想的情况。在广告点击预测领域,通过引入聚类方法,充分利用数据内在的隐式关系,有助于构建更准确、鲁棒性更好的分类模型。  相似文献   

11.
胡正平  路亮  许成谦 《信号处理》2011,27(6):874-882
最小生成树数据描述方法在刻画高维空间样本点分布时,将所有图形的边作为新增虚拟样本以提供同类样本分布描述,这种描述存在分支多覆盖模型复杂,且局部覆盖不够合理的问题。针对该问题,依据特征空间中同类样本分布的连续性规律,提出基于高维空间典型样本Steiner最小树覆盖模型的一类分类算法,该算法首先对目标类训练集进行样本修剪,去除冗余信息和噪声信息,选择最具代表性的样本作为训练集,然后对保留的典型样本构建Steiner最小树覆盖模型。算法分析和仿真实验结果表明,相比最小生成树数据描述,文中提出的方法能在较低覆盖模型复杂度的前提下更合理的描述目标类样本空间分布,构建更合理的覆盖模型,在分类正确率和适用样本规模上都表现出一定的优越性。   相似文献   

12.
在红外目标跟踪中,由于目标所处的背景信息复杂多变和目标外观的显著变化,单一的分类器不足以拟合多模态的数据。该文结合核相关滤波器(KCF)将多个核相关分类器通过集成学习整合到一个框架中。利用KCF分类器具有解析解的特点平衡跟踪鲁棒性与实时性之间的矛盾,从而解决单个分类器无法处理复杂背景与显著的外观变化问题,并显著提升目标跟踪的性能与稳定性。为了验证算法的有效性,该文利用两个核相关跟踪器联合学习出1个强分类器。大量的定性定量实验表明所提的算法的跟踪性能超过传统的KCF算法,且跟踪速度也超过大多数比较算法。  相似文献   

13.
结合集成比例训练的彩色JPEG图像隐写分析   总被引:1,自引:0,他引:1  
该文提出一种YCbCr颜色空间的彩色JPEG图像隐写分析方法。该方法中的特征包括通道内特征和通道间特征,首先从Y通道提取Markov特征,扩展DCT特征以及共生矩阵特征构成通道内特征集合,通道内特征可以有效捕捉到Y通道内DCT系数之间的相关性;然后对Y通道进行下采样,从采样平面与CbCr平面相互之间的差分平面上提取特征构成通道间特征集合,通道间特征可以捕捉到两两通道之间的相关性。由于通道内特征和通道间特征在分类性能上有着较大差别,在分类阶段由通道内特征和通道间特征分别训练子分类器,通过调整两类子分类器的比例,使用多数投票方式来合成集成判决结果,最终获得最佳的检测性能。实验结果表明,该方法不仅适合小嵌入率的彩色JPEG图像,而且在性能上优于已有的JPEG图像隐写分析方法。  相似文献   

14.
随着机器学习被广泛的应用,其安全脆弱性问题也突显出来。该文提出一种基于粒子群优化(PSO)的对抗样本生成算法,揭示支持向量机(SVM)可能存在的安全隐患。主要采用的攻击策略是篡改测试样本,生成对抗样本,达到欺骗SVM分类器,使其性能失效的目的。为此,结合SVM在高维特征空间的线性可分的特点,采用PSO方法寻找攻击显著性特征,再利用均分方法逆映射回原始输入空间,构建对抗样本。该方法充分利用了特征空间上线性模型上易寻优的特点,同时又利用了原始输入空间篡改数据的可解释性优点,使原本难解的优化问题得到实现。该文对2个公开数据集进行实验,实验结果表明,该方法通过不超过7%的小扰动量生成的对抗样本均能使SVM分类器失效,由此证明了SVM存在明显的安全脆弱性。  相似文献   

15.
基于视图的3维模型分类方法与深度学习融合能有效提升模型分类的准确率。但目前的方法将相同类别的3维模型所有视点上的视图归为一类,忽略了不同视点上的视图差异,导致分类器很难学习到一个合理的分类面。为解决这一问题,该文提出一个基于深度神经网络的3维模型分类方法。该方法在3维模型的周围均匀设置多个视点组,为每个视点组训练1个视图分类器,充分挖掘不同视点组下的3维模型深度信息。这些分类器共享1个特征提取网络,但却有各自的分类网络。为了使提取的视图特征具有区分性,在特征提取网络中加入注意力机制;为了对非本视点组的视图建模,在分类网络中增加了附加类。在分类阶段首先提出一个视图选择策略,从大量视图中选择少量视图用于分类,以提高分类效率。然后提出一个分类策略通过分类视图实现可靠的3维模型分类。在ModelNet10和ModelNet40上的实验结果表明,该方法在仅用3张视图的情况下分类准确率高达93.6%和91.0%。  相似文献   

16.
董远  张纪伟  赵楠  常晓夫  刘巍 《中国通信》2012,9(8):105-121
The rapid growth of multimedia content necessitates powerful technologies to filter, classify, index and retrieve video documents more efficiently. However, the essential bottleneck of image and video analysis is the problem of semantic gap that low level features extracted by computers always fail to coincide with high-level concepts interpreted by humans. In this paper, we present a generic scheme for the detection video semantic concepts based on multiple visual features machine learning. Various global and local low-level visual features are systematically investigated, and kernel-based learning method equips the concept detection system to explore the potential of these features. Then we combine the different features and sub-systems on both classifier-level and kernel-level fusion that contribute to a more robust system. Our proposed system is tested on the TRECVID dataset. The resulted Mean Average Precision (MAP) score is much better than the benchmark performance, which proves that our concepts detection engine develops a generic model and performs well on both object and scene type concepts.  相似文献   

17.
该文基于稀疏编码和集成学习提出了一种新的多示例多标记图像分类方法。首先,利用训练包中所有示例学习一个字典,根据该字典计算示例的稀疏编码系数;然后基于每个包中所有示例的稀疏编码系数计算包特征向量,从而将多示例多标记问题转化为多标记问题;最后利用多标记分类算法进行求解。为了提高分类器的泛化能力,对多个分类器进行集成。在多示例多标记图像数据集上的实验结果表明所提方法与其它方法相比有更好的性能。  相似文献   

18.
拥有庞大参数量的网络模型很难部署在智能手机、可穿戴智能设备等资源受限的移动设备上。从深度神经网络模型的基本原理出发,在现有压缩算法的基础上,采用优化剪枝策略与参数量化的方法相融合,提出了一种结果导向的数据驱动剪枝算法,利用低精度的量化算法来进一步压缩模型。使用VGGNet作为原始模型,在Kaggle猫狗图像和Oxford102植物样本集上进行微调。实验数据表明,使用本实验改进的方法,模型压缩的存储容量下降到113.1 MB,识别率提高到86.74%。  相似文献   

19.
R波作为确定心电信号各波段的重要参考,是心电自动分析的前提.针对大多数R波识别算法的预处理过程影响识别准确度和耗时问题,该文提出一种基于集合经验模态分解(EEMD)和信号结构分析的算法对带噪心电信号(ECG)的R波直接进行识别.首先通过EEMD将带噪声的心电信号分解成一系列本征模态分量,然后对分解后的各模态分量作独立成...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号