首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
聚类作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。提出的基于交集的聚类组合新方法,借鉴了选举投票的思想。给定同一数据集的不同聚类结果,此算法先求出不同聚类结果中每个簇的对应关系,然后计算这几个聚类结果对应簇的交集,对剩余的有争议对象进行投票,最后把投票之后仍未确定归属的对象分配给最近对象所在的簇,或者不经过投票直接将有争议的对象分配给最近对象所在的簇。实验表明,两种方法都能明显改善聚类质量,投票后得到的结果要略优于不投票的结果。  相似文献   

2.
传统随机森林分类算法采用平均多数投票规则不能区分强弱分类器,而且算法中超参数的取值需要调节优化.在研究了随机森林算法在文本分类中的应用技术及其优缺点的基础上对其进行改进,一方面对投票方法进行优化,结合决策树的分类效果和预测概率进行加权投票,另一方面提出一种结合随机搜索和网格搜索的算法对超参数调节优化.Python环境下的实验结果表明本文方法在文本分类上具有良好的性能.  相似文献   

3.
基于概率投票策略的多类支持向量机及应用   总被引:5,自引:1,他引:4       下载免费PDF全文
王晓红 《计算机工程》2009,35(2):180-183
传统的支持向量机是基于两类问题提出的,如何将其有效地推广至多类分类仍是一个研究的热点问题。在分析比较现有支持向量机多类分类OVO方法存在的问题及缺点的基础上,该文提出一种新的基于概率投票策略的多类分类方法。在该策略中,充分考虑了OVO方法中各个两类支持向量机分类器的差异,并将该差异反映到投票分值上。所提多类支持向量机方法不仅具有较好的分类性能,而且有效解决了传统投票策略中存在的拒分区域问题。将基于概率投票的多分类支持向量机作为关键技术应用于实际齿轮箱故障诊断,并与传统投票策略的结果进行对比,表明所提方法的上述优点。  相似文献   

4.
通过充分利用多个基分类器间的差异,集成分类器能够有效提高泛化精度,但是分类复杂度也随之增加.针对一类典型基于重采样和投票法的集成分类器,根据少数服从多数原则,在不影响分类精度的前提下给出了硬截止投票方法;针对基于Bagging的SVM集成的特点,引入概率分析,分析根据集成中部分投票预测集成结果的损失概率,给出了基于损失概率的软截止投票方法,该方法可推广到其他基于重采样技术与投票法的集成分类系统.对一个人工数据集和两个UCI数据集的实验表明该方法在保证分类精度的前提下,大幅提高了分类速度.  相似文献   

5.
对数据流分类分析的常用方法是集成学习。为了得到更好的分类效果,给出一种基于堆叠集成的数据流分类分析方法。该方法通过构造一个分类器对基分类器进行集成。实验结果表明,与基于投票或加权投票的集成方法相比,基于堆叠集成方法对概念漂移的快速适应能力以及预测准确率得到了提高。  相似文献   

6.
在音乐流派分类过程中,音乐流派局部特征与整体特征不一致时,通常采用的局部特征投票取最大的方法(MaxVote)在音频片段流派分类精度不高,而流派特征分布比较均衡时分类结果不合理。针对以上问题,该文提出基于音乐片段流派分布特征的神经网络投票机制(NNVote)和结合高层音乐节奏特征的RhythmNNVote投票方法。实验结果表明,NNVote方法在7个流派上的分类总精度达到68.9%,较MaxVote提高将近10%。  相似文献   

7.
为提高细粒度图像分类的准确率和速度,提出区域投票分类模型和区域置信度机制以及基于轻量化区域置信网络的细粒度图像分类方法。将轻量化卷积神经网络分类器替换为区域投票分类器,加入区域置信机制,增加分类网络对于关键特征分类的权重,提升轻量化模型的准确率。在Cub200-2011数据集上的实验结果验证了区域投票模型和区域置信机制的有效性。相较于其它主流细粒度图像分类算法,改进后的模型仅损失了少量精度,却大幅减少了参数量和所需运算资源。  相似文献   

8.
文本分类技术研究*   总被引:22,自引:2,他引:20  
对文本分类技术进行研究,介绍文本分类的基本过程,论述文本特征提取方法,讨论朴素贝叶斯、K-近邻、支持向量机、投票等常用的文本分类原理与方法,探讨中文文本分类技术。  相似文献   

9.
针对众包数据处理中的质量控制问题,提出了一种加权K近邻投票分类方法。该方法不单单只是考虑了某个样例的标记来返回一个答案,而是通过综合考虑样例的近邻来得到更加准确的答案。同时对样例的近邻加以适当的权重来进一步提高算法的性能,并保持了传统多数投票分类的简单性。K近邻投票分类算法可以有效地解决缺乏标记的情况,通过对近邻加以权重可以解决不平衡标记造成的影响,从而使算法的泛化性更强。通过各种场景下的实验,结果表明加权K近邻投票分类方法取得了很好的效果。  相似文献   

10.
滨海湿地信息提取方法比较研究   总被引:1,自引:0,他引:1       下载免费PDF全文
以江苏省典型滨海湿地为研究对象,利用2005年5月26日的Landsat7 ETM+图像数据,在湿地特征及其遥感图像表征分析的基础上,逐步提高湿地信息的提取精度,通过对多光谱遥感图像特征向量的分析,总结出一些湿地信息提取的规则和方法。在滨海湿地光谱特征分析的基础上,对研究区的图像进行了非监督分类,利用湿地的光谱相应特征、纹理特征、主成分变换、归一化差异水体指数等特征和相应的知识规则,得到用于优化分类的知识规则,采用分层分类的方法对非监督分类的结果进行了优化,从而使提取结果的精度较原来有了很大程度的提高。还利用给予数据挖掘的分层分类法进行分类比较,通过建立误差矩阵和对比各种分类方法的分类精度,总结出一套分类精度较高的针对该研究区的湿地信息提取方法。  相似文献   

11.
12.
为降低合成孔 径雷达(Synthetic aperture radar, SAR)图像目标识别中目标方位角的影响,并提高对SAR变形目标的识别率,本文提出了一种基于压缩感知和支持向量机决策级融合的目标识别算法。该算法首先基于稀疏表征理论将SAR目标识别问题描述为压缩感知的稀疏信号恢复问题,然后基于稀疏系数分别进行目标类别判别与方位角估计。对样本进行姿态校正后,利用支持向量机分别对经过姿态校正和未经姿态校正的样本进行目标分类。最后采用投票表决法对3种算法的分类结果进行决策级融合。实验结果表明,基于压缩感知结果进行目标方位角估计有效,且随着训练样本数的增加,提出的决策级融合算法提高了SAR变形目标的识别率。  相似文献   

13.
选票信息的自动处理能提高录入速度、保证选的公正性,绝大多数的选票信息自动处理系统都是采用光学标记识别的方法。该方法对于选票纸张和填写要求较高,而且误识率较高,该文提出了一种基于神经网络和学习子空间光学字符识别(OCR)方法。该识别方法具有对纸张和填写的要求低,精度高、通用性好的特点。  相似文献   

14.
提出一种基于组件词表的物体识别方法,通过AdaBoost从物体样本图像的组件中选取一些最具区分性的组件,构成组件词表。每幅图像都用词表中的组件来表征,在此基础上用稀疏神经网络来训练分类器。实验结果表明,该方法识别精度较高,对于遮挡和复杂背景有较强的鲁棒性。  相似文献   

15.
A deformation technique is a method to deform any part of, or an entire object, into a desired shape. Existing deformation methods take a lot of computational cost to represent smoothness correctly due to the constraints caused by differential coefficients of high degree. Thus, it is very difficult to find a general solution. In this paper we propose a LSM (layered subdivision method) that integrates a controlling mechanism, surface deformation, and mesh refinement processing 3D modeling and free-form deformable object matching. The proposed method is considerably more efficient and robust when compared to the existing method of free-form surface, because of the computation of the reference points of deformation edge using geometry of free-form surface. This approach can be applied to automatic inspection of NURBS models and object recognition.  相似文献   

16.
The generalized Hough transform (GHT) is a powerful method for recognizing arbitrary shapes as long as the correct match accounts for both much of the model and much of the sensory object. For moderate levels of occlusion, however, the GHT can hypothesize many false solutions. In this paper, we present an improved two-stage GHT procedure for the recognition of overlapping objects. Each boundary point in the image is described by three features including the concavity, radius and normal direction of the curve segment in the neighborhood of the point. The first stage of the voting process determines the rotational angle of the sensory object with respect to the model by matching those points that have the same concavity and radii. The second stage then determines the centroid of the sensory object by matching those points that have the same concavity, radii and rotational angles. The three point features remove the false contribution of votes in the vote generation phase. Experimental results have shown that the proposed algorithm works well for complex objects under severely overlapping conditions.  相似文献   

17.
Unlike many other object recognition datasets which provide either category-level or within-category annotations, we introduce a novel dataset called “IAIR-CarPed” with layered semantic labels ranging from categories to fine-grained subcategories. These labels are collected from 20 subjects via strict psychophysical experiments. To the best of our knowledge, it is the first time that an object recognition dataset is built in this way to represent the adaptive and in-depth interpretations of objects in human vision. This dataset focuses on “car” and “pedestrian” which are two representative categories important in real applications. It contains 3132 images collected from pictures taken under various conditions and 8567 objects carefully annotated by all the 20 subjects. Besides fine-grained and layered semantic labels, five types of detailed visual difficulties of these objects are also provided, which can be adopted to evaluate the representation and generalization abilities of the recognition systems against individual difficulties. We present here the details of building this dataset, its statistics and properties, and then discuss possible applications of it with some primary experimental results.  相似文献   

18.
提出一种基于兴趣点多种特征融合的物体识别方法。利用简化的局部二值模式算子去除Harris冗余角点,提取感兴趣区域的3种特征并加权融合特征,在K最近邻(KNN)方法中引进加权因子计算特征距离函数,得到合适的分类器。实验结果表明,该方法能有效提高物体识别的正确率。  相似文献   

19.
在目标检测网络(ObjectNet)和场景识别网络相结合的方法中,由于ObjectNet提取的目标特征和场景网络提取的场景特征的维度和性质不一致,且目标特征中存在影响场景判断的冗余信息,导致场景识别的准确率低。针对这个问题,提出一种改进的结合目标检测的室内场景识别方法。首先,在ObjectNet中引入类转换矩阵(CCM),将ObjectNet输出的目标特征进行转化,使得目标特征的维度与场景特征的维度相一致,以此减少特征维度不一致带来的信息丢失;然后采用上下文门控(CG)机制对特征中的冗余信息进行抑制,从而降低不相关信息的权重,提高了目标特征在场景识别中的作用。该方法在MIT Indoor67数据集上的识别准确率达到90.28%,与维护空间布局的对象语义特征(SOSF)方法相比识别准确率提高了0.77个百分点;其在SUN397数据集上识别准确率达到81.15%,与交替专家层次结构(HoAS)方法相比识别准确率提高了1.49个百分点。实验结果表明,所提方法提高了室内场景识别的准确率。  相似文献   

20.
民主选举过程中选票的统计是一项严肃而繁琐的工作,传统的手工操作方法不仅效率低,而且在统计过程中很容易出错,影响了选举工作的进度及质量。选票信息的自动处理能提高录入速度、准确率和公正性。选票信息自动处理的核心是选票版面结构获取和填写信息识别。该文提出了一种基于边框线的选票版面分析方法,并采用OCR(OpticalCharacterRecognition)识别填写信息,该方法具有对选票的设计更方便灵活、纸张和填写的要求低、精度高、通用性好的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号