共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
针对特征选择中降维效果与分类精度间的矛盾,通过分析传统的特征选择方法中的优点和不足,结合佳点集遗传算法的思想和K最近邻简单有效的分类特性,提出了基于佳点集遗传算法的特征选择方法.该算法对特征子集采用佳点集遗传算法进行随机搜索,并采用K近邻的分类错误率作为评价指标,淘汰不好的特征子集,保存较优的特征子集.通过实验比较看出,该算法可以有效地找出具有较高分类精度的特征子集,降维效果良好,具有较好的特征子集选择能力. 相似文献
3.
基于最近邻距离差的改进孤立点检测算法 总被引:1,自引:0,他引:1
k最近邻孤立点检测算法的检测结果受用户设置参数的影响较大,并且无法判定孤立点强弱,针对该缺陷,引入阈半径和密集度阈值,提出基于最近邻距离差的孤立点检测算法.通过在多个数据集上的实验表明,改进算法扩大了参数的设置范围,降低了参数对结果的影响,并能够有效检测出强孤立点,用户通过调整密集度阈值,可以判定孤立点强弱,改进算法增强了原算法的稳定性和灵活性. 相似文献
4.
实例选择能有效移除数据中的噪声和冗余数据,但现有方法难以在提高泛化能力的同时实现约简。针对该问题,提出一种冗余实例对消除算法用于实例选择。给出最近同类实例对的概念,计算数据集中存在的最近同类实例对,并移除满足条件的实例,在11个不同数据集上进行的仿真实验结果表明,经过该算法处理后的数据集在分类准确率和存储压缩率上较原始样本集有明显提升。对比剪辑最近邻规则算法,该算法能够在保持分类准确率的同时提高平均存储压缩率35%以上,并完整保留原始样本集的数据分布特征,在分类准确率和存储压缩率上取得折中。 相似文献
5.
为解决伪标签筛选过程的位置噪声数据问题,提出了基于定位置信度加权的Soft Teacher-LAH半监督目标检测算法。通过离散化目标检测网络定位分支的预测输出,引入具有定位感知功能的输出结构LAH。基于LAH预测输出,定义一种衡量定位精度的置信度指标,设计基于该置信度加权的无监督定位损失函数,降低伪标签位置噪声对模型训练的负面影响。实验结果表明了该算法的性能优势,针对微软COCO数据集,在有标注数据占比训练集分别为1%、5%和10%的场景下,该算法相比于现有Soft Teacher方案的平均精度分别提高了1.1、1.2和1.5个百分点;针对PASCAL VOC数据集,在使用VOC07和VOC12分别作为有标注和无标注训练数据的场景下,该算法相比Soft Teacher方案的平均精度提高了1.6个百分点。 相似文献
6.
传统的聚类算法是一种无监督的学习过程,聚类的精度受到相似性度量方式以及数据集中孤立点的影响,并且算法也没有很好的利用先验知识,无法体现用户的需求。因此提出了基于共享最近邻的孤立点检测及半监督聚类算法。该算法采用共享最近邻为相似度,根据数据点的最近邻居数目来判断是否为孤立点,并在删除孤立点的数据集上进行半监督聚类。在半监督聚类过程中加入了经过扩展的先验知识,同时根据图形分割原理对数据集进行聚类。文中使用真实的数据集进行仿真,其仿真结果表明,本文所提出的算法能有效的检测出孤立点,并具有很好的聚类效果。 相似文献
7.
8.
针对基于密度的聚类方法不能发现密度分布不均的数据样本的缺陷,提出了一种基于代表点和点密度的聚类算法。算法通过检查数据库中每个点的k近邻来寻找聚类。首先选取一个种子点作为类的第一个代表点,其k近邻为其代表区域,如果代表区域中的点密度满足密度阈值,则将该点作为一个新的代表点,如此反复地寻找代表点,这些区域相连的代表点及其代表区域将构成一个聚类。实验结果表明,该算法能够发现任意形状、大小和密度的聚类。 相似文献
9.
稀疏码分多址(即非正交多址)(Sparse Code Multiple Access,SCMA) 技术,具有在有限频谱资源下过载通信的特点,能够显著提升频谱利用率。得益于稀疏码分多址码本的稀疏性,消息传递算法(Message Passing Algorithm,MPA)成为经典多用户检测算法。在传统MPA方法中,尽管与最大似然译码具有相近的误比特率(Bit Error Ratio,BER)性能,但指数运算的复杂度仍然很高。据此,设计一种基于置信度的动态边缘选择更新方法,以减少不必要的节点运算。每次迭代中,利用因子图模型中功能节点到变量节点的置信度稳定性信息,动态判定是否需要节点更新运算。仿真结果表明,动态边缘选择方案使得算法的复杂度得到显著降低,并且能够与BER取得良好的均衡。 相似文献
10.
陈宗雄 《数字社区&智能家居》2014,(23):5496-5500
介绍了一种简易的LED数字识别的算法。与传统的数字识别方法相比较,识别精度较高。该算法对采集到的4个数字字符二值化后的图像用最近邻算法,并对最近邻得到的结果的置信度进行评估实现数字的识别。利用该方法时,通过对置信度的评估,只有4个数字都具有较高置信度的识别结果才能被接受,否则单独对某个字符重新细化处理,大大提高了识别的精度。减少因镜头模糊,倾斜,光照等因素而造成采集得到的图像的中字符发生的旋转,粘连,部分缺失而引起的误识。在以此算法为基础对256幅图片,每幅图片上4个字符的数字同时进行识别测试,正确识别率达到97.66%,误识率仅为2.34%。实验表明,该算法在识别精度、抗干扰性方面表现良好。 相似文献
11.
针对传统K近邻分类器在大规模数据集中存在时间和空间复杂度过高的问题,可采取原型选择的方法进行处理,即从原始数据集中挑选出代表原型(样例)进行K近邻分类而不降低其分类准确率.本文在CURE聚类算法的基础上,针对CURE的噪声点不易确定及代表点分散性差的特点,利用共享邻居密度度量给出了一种去噪方法和使用最大最小距离选取代表点进行改进,从而提出了一种新的原型选择算法PSCURE (improved prototype selection algorithm based on CURE algorithm).基于UCI数据集进行实验,结果表明:提出的PSCURE原型选择算法与相关原型算法相比,不仅能筛选出较少的原型,而且可获得较高的分类准确率. 相似文献
12.
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。 相似文献
13.
14.
无监督特征选择算法可以对高维无标记数据进行有效的降维,从而减少数据处理的时间和空间复杂度,避免算法模型出现过拟合现象.然而,现有的无监督特征选择方法大都运用k近邻法捕捉数据样本的局部几何结构,忽略了数据分布不均的问题.为了解决这个问题,提出了一种基于自适应邻域嵌入的无监督特征选择(adaptive neighborhood embedding based unsupervised feature selection, ANEFS)算法,该算法根据数据集自身的分布特点确定每个样本的近邻数,进而构造样本相似矩阵,同时引入从高维空间映射到低维空间的中间矩阵,利用拉普拉斯乘子法优化目标函数进行求解.6个UCI数据集的实验结果表明:所提出的算法能够选出具有更高聚类精度和互信息的特征子集. 相似文献
15.
16.
基于相异性选择的密度聚类算法研究 总被引:4,自引:0,他引:4
在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算(EOptiSim)。由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用0ptiSim或EOptiSim多样化代表性子集选择技术。在显著降低I/O耗费和内存需求的同时,不仅能够有效地聚类单一的大规模空间数据库,而且还能聚类大规模组合数据库或分布式数据库.实验结果表明本文的算法是可行、有效的. 相似文献
17.
一种改进选择算子和基于小生境的遗传算法 总被引:5,自引:0,他引:5
陈友文 《计算机与数字工程》2009,37(6):21-24
为了进一步提高遗传算法选择算子的选优能力,在传统轮盘赌的基础上提出了一种基于排序的多轮轮盘赌选择算子,在提高了算子选优能力的同时也减少了随机性所产生的误差;同时采用了小生境技术,使得算法既能保证多样性又能够保留最优解。实验表明,与简单遗传算法相比较,新算法能够有效地提高收敛速度。 相似文献
18.
19.