首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
代表点选择是面向数据挖掘与模式识别的数据预处理的重要内容之一,是提高分类器分类正确率和执行效率的重要途径。提出了一种基于投票机制的代表点选择算法,该算法能使所得到的代表点尽可能分布在类别边界上,且投票选择机制易于排除异常点,减少数据量,从而有利于提高最近邻分类器的分类精度和效率。通过与多个经典的代表点选择算法的实验比较分析,表明所提出的基于投票机制的代表点选择算法在提高最近邻分类器分类精度和数据降低率上都具有一定的优势。  相似文献   

2.
针对特征选择中降维效果与分类精度间的矛盾,通过分析传统的特征选择方法中的优点和不足,结合佳点集遗传算法的思想和K最近邻简单有效的分类特性,提出了基于佳点集遗传算法的特征选择方法.该算法对特征子集采用佳点集遗传算法进行随机搜索,并采用K近邻的分类错误率作为评价指标,淘汰不好的特征子集,保存较优的特征子集.通过实验比较看出,该算法可以有效地找出具有较高分类精度的特征子集,降维效果良好,具有较好的特征子集选择能力.  相似文献   

3.
基于最近邻距离差的改进孤立点检测算法   总被引:1,自引:0,他引:1  
k最近邻孤立点检测算法的检测结果受用户设置参数的影响较大,并且无法判定孤立点强弱,针对该缺陷,引入阈半径和密集度阈值,提出基于最近邻距离差的孤立点检测算法.通过在多个数据集上的实验表明,改进算法扩大了参数的设置范围,降低了参数对结果的影响,并能够有效检测出强孤立点,用户通过调整密集度阈值,可以判定孤立点强弱,改进算法增强了原算法的稳定性和灵活性.  相似文献   

4.
实例选择能有效移除数据中的噪声和冗余数据,但现有方法难以在提高泛化能力的同时实现约简。针对该问题,提出一种冗余实例对消除算法用于实例选择。给出最近同类实例对的概念,计算数据集中存在的最近同类实例对,并移除满足条件的实例,在11个不同数据集上进行的仿真实验结果表明,经过该算法处理后的数据集在分类准确率和存储压缩率上较原始样本集有明显提升。对比剪辑最近邻规则算法,该算法能够在保持分类准确率的同时提高平均存储压缩率35%以上,并完整保留原始样本集的数据分布特征,在分类准确率和存储压缩率上取得折中。  相似文献   

5.
为解决伪标签筛选过程的位置噪声数据问题,提出了基于定位置信度加权的Soft Teacher-LAH半监督目标检测算法。通过离散化目标检测网络定位分支的预测输出,引入具有定位感知功能的输出结构LAH。基于LAH预测输出,定义一种衡量定位精度的置信度指标,设计基于该置信度加权的无监督定位损失函数,降低伪标签位置噪声对模型训练的负面影响。实验结果表明了该算法的性能优势,针对微软COCO数据集,在有标注数据占比训练集分别为1%、5%和10%的场景下,该算法相比于现有Soft Teacher方案的平均精度分别提高了1.1、1.2和1.5个百分点;针对PASCAL VOC数据集,在使用VOC07和VOC12分别作为有标注和无标注训练数据的场景下,该算法相比Soft Teacher方案的平均精度提高了1.6个百分点。  相似文献   

6.
传统的聚类算法是一种无监督的学习过程,聚类的精度受到相似性度量方式以及数据集中孤立点的影响,并且算法也没有很好的利用先验知识,无法体现用户的需求。因此提出了基于共享最近邻的孤立点检测及半监督聚类算法。该算法采用共享最近邻为相似度,根据数据点的最近邻居数目来判断是否为孤立点,并在删除孤立点的数据集上进行半监督聚类。在半监督聚类过程中加入了经过扩展的先验知识,同时根据图形分割原理对数据集进行聚类。文中使用真实的数据集进行仿真,其仿真结果表明,本文所提出的算法能有效的检测出孤立点,并具有很好的聚类效果。  相似文献   

7.
针对现有的增量聚类算法对参数敏感度较高、时空复杂度较高等问题,提出了一种基于代表点的增量聚类算法。首先采用代表点聚类算法对静态的数据库进行聚类;然后根据新增加的节点与已存的代表点之间的关系,判断是否将其添加到已存的代表点所属的类簇中,或是提升为新的代表点;最后,再次采用代表点聚类算法对其进行聚类。实验结果证明,该算法对参数的敏感性低、效率高、占用空间小。  相似文献   

8.
针对基于密度的聚类方法不能发现密度分布不均的数据样本的缺陷,提出了一种基于代表点和点密度的聚类算法。算法通过检查数据库中每个点的k近邻来寻找聚类。首先选取一个种子点作为类的第一个代表点,其k近邻为其代表区域,如果代表区域中的点密度满足密度阈值,则将该点作为一个新的代表点,如此反复地寻找代表点,这些区域相连的代表点及其代表区域将构成一个聚类。实验结果表明,该算法能够发现任意形状、大小和密度的聚类。  相似文献   

9.
李茂  周志刚  王涛 《计算机科学》2019,46(1):138-142
稀疏码分多址(即非正交多址)(Sparse Code Multiple Access,SCMA) 技术,具有在有限频谱资源下过载通信的特点,能够显著提升频谱利用率。得益于稀疏码分多址码本的稀疏性,消息传递算法(Message Passing Algorithm,MPA)成为经典多用户检测算法。在传统MPA方法中,尽管与最大似然译码具有相近的误比特率(Bit Error Ratio,BER)性能,但指数运算的复杂度仍然很高。据此,设计一种基于置信度的动态边缘选择更新方法,以减少不必要的节点运算。每次迭代中,利用因子图模型中功能节点到变量节点的置信度稳定性信息,动态判定是否需要节点更新运算。仿真结果表明,动态边缘选择方案使得算法的复杂度得到显著降低,并且能够与BER取得良好的均衡。  相似文献   

10.
介绍了一种简易的LED数字识别的算法。与传统的数字识别方法相比较,识别精度较高。该算法对采集到的4个数字字符二值化后的图像用最近邻算法,并对最近邻得到的结果的置信度进行评估实现数字的识别。利用该方法时,通过对置信度的评估,只有4个数字都具有较高置信度的识别结果才能被接受,否则单独对某个字符重新细化处理,大大提高了识别的精度。减少因镜头模糊,倾斜,光照等因素而造成采集得到的图像的中字符发生的旋转,粘连,部分缺失而引起的误识。在以此算法为基础对256幅图片,每幅图片上4个字符的数字同时进行识别测试,正确识别率达到97.66%,误识率仅为2.34%。实验表明,该算法在识别精度、抗干扰性方面表现良好。  相似文献   

11.
针对传统K近邻分类器在大规模数据集中存在时间和空间复杂度过高的问题,可采取原型选择的方法进行处理,即从原始数据集中挑选出代表原型(样例)进行K近邻分类而不降低其分类准确率.本文在CURE聚类算法的基础上,针对CURE的噪声点不易确定及代表点分散性差的特点,利用共享邻居密度度量给出了一种去噪方法和使用最大最小距离选取代表点进行改进,从而提出了一种新的原型选择算法PSCURE (improved prototype selection algorithm based on CURE algorithm).基于UCI数据集进行实验,结果表明:提出的PSCURE原型选择算法与相关原型算法相比,不仅能筛选出较少的原型,而且可获得较高的分类准确率.  相似文献   

12.
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。  相似文献   

13.
刘丽芳  孟志刚  张常利 《软件》2012,(2):114-116
本文针对遗传算法具有早熟或局部收敛的缺点,根据种群熵S的实际意义,设计了一种可按照当前种群熵S的大小自动切换适应度函数的自适应适应度函数。对基本遗传算法,分别采用指数适应度函数,反比例适应度函数和本文定义的自适应适应度函数,在三种常用检测函数上进行实验,结果表明采用自适应适应度函数的基本遗传算法继承了指数适应度函数和反比例适应度函数的优点,既有强劲的收敛能力,又能保持种群多样性,可以更好更快更精确地收敛到问题的最优解。  相似文献   

14.
无监督特征选择算法可以对高维无标记数据进行有效的降维,从而减少数据处理的时间和空间复杂度,避免算法模型出现过拟合现象.然而,现有的无监督特征选择方法大都运用k近邻法捕捉数据样本的局部几何结构,忽略了数据分布不均的问题.为了解决这个问题,提出了一种基于自适应邻域嵌入的无监督特征选择(adaptive neighborhood embedding based unsupervised feature selection, ANEFS)算法,该算法根据数据集自身的分布特点确定每个样本的近邻数,进而构造样本相似矩阵,同时引入从高维空间映射到低维空间的中间矩阵,利用拉普拉斯乘子法优化目标函数进行求解.6个UCI数据集的实验结果表明:所提出的算法能够选出具有更高聚类精度和互信息的特征子集.  相似文献   

15.
杜鹏  周昌乐  贺志强 《微机发展》2007,17(4):150-153
遗传算法作曲就是利用遗传算法来实现乐曲的生成,在创作的过程中遗传算法按照事先给定的规则进行进化,从而使得人在计算机创作的过程中介入程度达到最小。动机是巴赫创意曲中的核心旋律和主题,文中采用遗传算法对创意曲中动机的自动生成进行了探讨。介绍了遗传算法创作动机的基本过程,即按照动机创作的音乐知识规则来设置适应度函数,采用遗传算法中的选择、交叉和变异算子产生动机片段,最终达到生成自动生成动机片段的效果。  相似文献   

16.
基于相异性选择的密度聚类算法研究   总被引:4,自引:0,他引:4  
在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算(EOptiSim)。由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用0ptiSim或EOptiSim多样化代表性子集选择技术。在显著降低I/O耗费和内存需求的同时,不仅能够有效地聚类单一的大规模空间数据库,而且还能聚类大规模组合数据库或分布式数据库.实验结果表明本文的算法是可行、有效的.  相似文献   

17.
一种改进选择算子和基于小生境的遗传算法   总被引:5,自引:0,他引:5  
为了进一步提高遗传算法选择算子的选优能力,在传统轮盘赌的基础上提出了一种基于排序的多轮轮盘赌选择算子,在提高了算子选优能力的同时也减少了随机性所产生的误差;同时采用了小生境技术,使得算法既能保证多样性又能够保留最优解。实验表明,与简单遗传算法相比较,新算法能够有效地提高收敛速度。  相似文献   

18.
基于Rollout算法的模拟电路测点选择   总被引:1,自引:0,他引:1  
针对模拟电路的测点选择问题,对整数编码故障字典进行了研究.分析了基于信息熵算法的测点选择算法,并采用Rollout算法对信息熵算法进行优化,建立了一种新的测点选择算法,给出了新算法的详细计算过程和计算效果.试验结果表明,新算法的计算效果优于信息熵算法,且随着故障字典复杂度的增加,优势更加明显.  相似文献   

19.
段爱玲  王伟  程凤娟 《计算机工程》2009,35(19):189-191
评标是工程项目投标中的重要环节,利用遗传算法进行评标,其难点在于缺乏合理可行的适应度函数设计方法。在给出遗传算法编码规则的基础上,引入层次分析法(AHP)进行适应度函数设计,通过实例计算,阐述利用AHP方法进行适应度函数设计的全过程。结果证明,该算法可有效应用于工程项目评标。  相似文献   

20.
研究太阳能电池提高光电转换率问题,由于光伏发电系统中最大功率点难以实时跟踪,使光伏阵列输出功率达不到要求。为此提出采用克隆选择算法进行优化控制。根据光伏电池等效电路模型在SIMULINK中建立仿真模型进行特性分析,并编写克隆选择算法。通过在算法进化过程中合理地选取种群规模、克隆规模和变异率等参数,从而保证算法以最佳的搜索轨迹达到最优解。通过对算法有效性的验证,仿真结果表明:在温度、光强变化情况下,能实时跟踪到最大功率点,提高系统的鲁棒性和发电效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号