共查询到20条相似文献,搜索用时 15 毫秒
1.
运用K最近邻分类算法建立在校生考研预测模型,便于对在校生进行考前预判。为了提高预测的准确率,对传统K最近邻分类算法进行了改进,对样本的各特征属性赋予了不同权重,通过传统和加权两种K最近邻分类算法的不同使用,验证了改进加权KNN算法的实践效果。 相似文献
2.
KNN算法在数据分析领域有着重要的应用。文章针对KNN算法中参数k选择不合理将导致分类结果准确率低的问题,将K折交叉验证法应用于KNN算法中k值的选取,通过k值分析图选取最佳k值,利用Python语言并基于Sklearn库实现KNN算法。在鸢尾花数据集上的实验表明,该模型是进行花卉分类的有效方法。 相似文献
3.
改进的KNN文本分类算法 总被引:1,自引:0,他引:1
而文本自动分类,作为一种有效的提高文本检索速度和准确率的方法,在电子文本信息管理中起着非常重要的作用。KNN算法作为一种非常简单,但是有效的文本分类算法,被广泛运用。针对传统KNN算法中对特征项的非监督权重分配的不足之处做了改进,采取x2统计量方法和信息增益这两种监督权重分配方法,有效地利用了训练集标签信息,提高了KNN算法的精确度。 相似文献
4.
KNN算法在数据处理,文本分类等方面都有着广泛的应用;本文提出了一种基于高斯函数权重分配的改进KNN算法(G-KNN)分类模型,并对该模型进行了理论推导和数学分析.分析了权重参数c和k值对分类性能的影响以及最优值的选取,并分别采用地中海数据和一组UCI公开数据对该算法进行了仿真验证.结果表明,改进算法的性能优于传统KN... 相似文献
5.
6.
传统的KNN算法采用欧氏距离公式,文章中的KNN算法分别采用欧式距离公式、切比雪夫距离公式、曼哈顿距离公式对鸢尾花数据集进行分类,在不同距离公式下,分类结果的准确率具有一定的区别,采用切比雪夫距离公式时,分类结果的准确率达到100%,对以后KNN算法的研究及应用具有重要意义。 相似文献
7.
为解决传统的人工排查违规电器方式在时效与规模上存在的局限性,同时也为了预防因使用违规电器而引发的安全事故,研究并设计了一个用电安全智能监控系统。本系统由用电安全执行终端和用电安全监控平台组成,执行终端主要由树莓派3B+微型计算机和四路交流电流电压采集模块组成,实现了对宿舍用电状况的自动监测、违规电器的自主识别和断复电操作;监控平台实现了对电器使用情况的实时监控、短信预警和违规记录存储等功能。选取有功功率增量和视在功率增量作为特征量,通过KNN(K最近邻)算法进行电器识别,实验结果表明,该系统的用电器平均识别正确率高达95%以上,并且可以及时预警且限制学生公寓违规电器的使用,能有效降低因使用违规电器所带来的生命和财产风险。 相似文献
8.
基于KNN的汉语问句分类 总被引:1,自引:0,他引:1
汉语问句分类是问答系统中重要的组成部分,问句分类结果的好坏直接影响问答系统的质量。利用知网(HowNet)义原树计算问句之间的语义相似度,并以此作为句子之间的距离度量,利用KNN算法构造分类器进行问句分类,并对最近邻分类算法、KNN分类算法及改进的KNN分类算法进行实验比较。结果表明加权的KNN分类器分类效果最好,达到了89.8%的精确率。 相似文献
9.
本文针对KNN算法在处理医疗大数据时存在的不足进行了研究,提出了一种基于域数加权的分层KNN算法.算法根据医学领域的专业知识,构建n层体系结构,在外层分类时有效地降低了分类的无效计算量;同时随着层数加深,文本聚合明显,此时根据近邻域数进行选择性文本加权,有效地提高了分类精度.实验结果表明,该算法在对样本容量大、类别聚合差异性较明显,分类精度要求高的医疗数据进行分类时能取得较好的分类效果. 相似文献
10.
体能训练是提高消防员战斗力的重要途径之一,特别是对长时间处于灭火救援工作一线的消防员而言,体能训练的质量直接影响消防单位的整体战斗力。由于体能训练标准严格,受训消防员数量远超教员数量,针对消防员力量的体能训练不够充分。本文基于机器学习算法设计了消防体能训练识别系统,可以实现多种体能动作实时姿势的自动分类及计数功能。本文将体能训练问题转化为计算机视觉领域的人体姿态识别研究,利用Blaze Pose模型与KNN算法结合构建体能识别模型,通过提取关键点特征向量进行动作二分类,以实现动作计数功能;通过PCA降维实现体能多分类,模型准确率最高可达到98.19%,分类结果稳定可靠。 相似文献
11.
能量分析攻击至今仍是针对密码芯片最具威胁的攻击方法之一,针对传统的模板分析攻击和KNN算法的攻击进行对比研究,对比模板攻击和机器学习中的KNN优缺点。首先对皮尔逊相关系数、互信息和最大信息系数、距离相关系数3种降维方法进行了研究;然后对比了相同数量功耗曲线下,特征点数量对两种能量分析的成功率等性能的影响;同时研究了不同降维技术在相同功耗曲线数量和不同功耗曲线数量时对两种能量分析攻击的影响。结果表明,模板攻击在运行速度、占用内存方面优于KNN算法攻击,而在攻击成功率和鲁棒性方面,KNN算法攻击具有更好的表现。 相似文献
12.
13.
14.
15.
16.
针对Deep Web的查询需求,文章提出了改进的对Deep Web数据源的分类方法:在对数据源进行分类时,采用了KNN分类算法来进行。由于KNN分类算法的K值选的过大或者过小都会对分类结果产生影响,因此提出了对K值进行优化的改进的KNN算法。文章利用k-means聚类算法来进行聚类,分别计算取得每个类别的k个距离相近的数据并计算这k个数据到聚类中心的距离,把这个距离的倒数作为该数据点对分类结果的贡献值。对训练集进行聚类后返回聚类中心,根据聚类中心计算权重,从而进一步来计算每个类别中k个最近邻贡献值之和S,选取S最大的类别作为测试数据的类别来进行分类,从而可达到比较好的分类效果。 相似文献
17.
18.
一种基于数据偏斜的改进KNN文本分类 总被引:2,自引:1,他引:1
KNN是一种简单、有效、非参数的分类算法.针对样本分布偏斜的分类环境,首先提出了一种改进的特征选择方法进行特征降维,在此基础上进一步提出了一种基于分布的改进KNN方法用于文本分类,降低了分布偏斜问题对决策函数的影响.试验表明,所提出的改进KNN文本分类方法具有较好的分类性能. 相似文献