首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
运用K最近邻分类算法建立在校生考研预测模型,便于对在校生进行考前预判。为了提高预测的准确率,对传统K最近邻分类算法进行了改进,对样本的各特征属性赋予了不同权重,通过传统和加权两种K最近邻分类算法的不同使用,验证了改进加权KNN算法的实践效果。  相似文献   

2.
耿丽娟 《通讯世界》2017,(20):265-266
本文针对KNN算法在处理医疗大数据时存在的不足进行了研究,提出了一种基于域数加权的分层KNN算法.算法根据医学领域的专业知识,构建n层体系结构,在外层分类时有效地降低了分类的无效计算量;同时随着层数加深,文本聚合明显,此时根据近邻域数进行选择性文本加权,有效地提高了分类精度.实验结果表明,该算法在对样本容量大、类别聚合差异性较明显,分类精度要求高的医疗数据进行分类时能取得较好的分类效果.  相似文献   

3.
郑洁 《无线互联科技》2018,(20):105-106
随着信息技术的迅速发展,数据信息处理技术已经从原始的文件处理演变到复杂且功能强大的数据库系统,为了将这些数据信息转换成有用的知识信息,数据挖掘技术应运而生。数据集的数据质量低下会导致挖掘出的数据准确率明显降低,数据缺失是数据质量低下最常见的情况,为了提升数据质量,对缺失数据的修复问题是一项值得关注的热点问题。文章对缺失数据的修复主要是讨论连续型属性的数据类型,修复方法采用归因技术的思想,利用属性间的关系,用数据集中的现有值去估计那些相关的缺失值。并对比一种常用且高效的缺失值修复方法,在此基础上通过引入属性的特征权值,加强重要属性对数据修复计算的影响,进一步提高了数据修复的准确率。  相似文献   

4.
KNN算法在数据分析领域有着重要的应用。文章针对KNN算法中参数k选择不合理将导致分类结果准确率低的问题,将K折交叉验证法应用于KNN算法中k值的选取,通过k值分析图选取最佳k值,利用Python语言并基于Sklearn库实现KNN算法。在鸢尾花数据集上的实验表明,该模型是进行花卉分类的有效方法。  相似文献   

5.
数据在采集和传输过程中由于多种原因会造成矩阵残缺,因此在数据分析之前需要对残缺矩阵进行修复。常见的KNN修复方法 k值选取不合理,且需在整个矩阵中搜索近邻,影响算法的修复效果。在其基础上提出了一种k值自适应的局部KNN矩阵修复方法,合理考虑了k值的选取和近邻项的搜索范围。实验证明了该方法能有效提高矩阵修复的正确率,且算法的时效性有所提高。  相似文献   

6.
针对传统K-最近邻(K-Nearest Neighbor,KNN)算法在数据量较大时分类效率较低的问题,提出一种基于训练集聚类的加权KNN算法,通过模糊C均值(Fuzzy c-means,FCM)算法将训练集聚类,当有待测样本需要分类时,根据待测样本与各个类的位置关系快速查找k个最近邻,缩减了计算量,提出的算法还通过加权来减小k值的选择对分类结果的影响,经过数值实验验证了算法分类的准确性更好。  相似文献   

7.
本文首先系统梳理了数据缺失的概念、产生原因及机制;然后对数据缺失问题常见的处理方法进行综述,比较不同处理方法的优劣以及各自的适应范围;最后详细介绍了数据填充效果评价的常用方法.得出结论:根据不同数据集的特点选择合适的处理方法,才能取得良好的处理效果;指出了随着大数据时代的到来,精准高效的处理海量的数据是数据缺失处理未来的发展方向.  相似文献   

8.
张凡  高仲合  牛琨 《通信技术》2021,(5):1235-1239
互联网的不断发展和广泛使用给网络用户带来了极大的方便,但同时也使得网络安全形势变得越来越严峻.针对网络异常检测方法检测精度不高,网络环境动态不稳定的问题,提出了基于K-最近邻算法(K-Nearest Neighbor,KNN)的网络流量异常检测算法.算法基于属性加权与距离加权组合加权的方法进行异常检测,其中使用随机森林...  相似文献   

9.
针对不良的步态会对下肢的关节产生不利的影响(加重行走的负担,能量消耗过快等),以及加重患病的风险,提出了利用KNN(k-nearest neighbor)算法对足外8和足内8两种不良步态与正常步态(对照组)进行分类学习,获取分类模型。三种步态的三维步态数据是从17名受试者在正常行走期间通过3D运动捕捉系统获得的,KNN模型对三种步态识别的总正确率为81.7%,对足外8步态的正确率为92.8%以及足内8的正确率为91.0%。模型的正确率较为准确,可以为矫正不良步态提供有力支持、减少不良步态的检测成本。  相似文献   

10.
介绍了缺失数据属性值的一些处理方法,给出了一种新的基于主曲线的缺失数据属性值的恢复方法,详细地描述了利用该方法对缺失属性值进行恢复的步骤,这种方法能根据数据的特性对缺失属性值进行预测,处理的问题带有一般性,并用具体实验数据验证实验该方法的有效性,通过和其他方法进行比较验证了它的精确性.  相似文献   

11.
针对不平衡数据分类问题,在数据层面对不平衡数据集进行预处理,即对多数类数据进行先聚类,后欠采样的方式,减少多数类数据的数目,降低数据集的不平衡度,之后再用KNN算法对其进行分类。实验结果表明,对数据层面的预处理,使少数类数据的分类效果得到了提升。  相似文献   

12.
用于特征筛选的基于目标值的最近邻法   总被引:3,自引:0,他引:3  
用传统的最近邻(KNN)法找出最近邻点后,利用曲面平滑化原理,按照这些点的目标值分布情况进行模式识别识别的特征筛选,与基于分类的最近邻法比,减少了人为的分类过程。  相似文献   

13.
黄炜 《信息技术》2011,(6):173-176
KNN算法在决定测试样本的分类时,如果样本数量太大,那么在搜索测试样本的K个最邻近时的算法计算量很大。针对KNN的不足提出了一种改进方法,在对数据进行预处理的基础上,实现了K最近邻居分类算法。结合发电企业行业及专业数据信息检索的特点,通过KNN算法,对终端用户输入的检索关键字集合进行了预处理,生成了新的检索关键字集合。  相似文献   

14.
本文详细介绍了一种LTE网络业务量各时间维度的预测方法,引入O+B域建立用户画像,结合大数据建立LTE网络预测模型,对LTE网络未来小区内用户数、业务量等数据进行预测,同时可以把控网络局部短期变化,从而支撑快速优化调整应对。基于用户感知建立不同场景下扩容标准,预估网络资源。  相似文献   

15.
针对Deep Web的查询需求,文章提出了改进的对Deep Web数据源的分类方法:在对数据源进行分类时,采用了KNN分类算法来进行。由于KNN分类算法的K值选的过大或者过小都会对分类结果产生影响,因此提出了对K值进行优化的改进的KNN算法。文章利用k-means聚类算法来进行聚类,分别计算取得每个类别的k个距离相近的数据并计算这k个数据到聚类中心的距离,把这个距离的倒数作为该数据点对分类结果的贡献值。对训练集进行聚类后返回聚类中心,根据聚类中心计算权重,从而进一步来计算每个类别中k个最近邻贡献值之和S,选取S最大的类别作为测试数据的类别来进行分类,从而可达到比较好的分类效果。  相似文献   

16.
Video semantic detection has been one research hotspot in the field of human-computer interaction. In video features-oriented sparse representation, the features from the same category video could not achieve similar coding results. To address this, the Locality-Sensitive Discriminant Sparse Representation (LSDSR) is developed, in order that the video samples belonging to the same video category are encoded as similar sparse codes which make them have better category discrimination. In the LSDSR, a discriminative loss function based on sparse coefficients is imposed on the locality-sensitive sparse representation, which makes the optimized dictionary for sparse representation be discriminative. The LSDSR for video features enhances the power of semantic discrimination to optimize the dictionary and build the better discriminant sparse model. More so, to further improve the accuracy of video semantic detection after sparse representation, a weighted K-Nearest Neighbor (KNN) classification method with the loss function that integrates reconstruction error and discrimination for the sparse representation is adopted to detect video semantic concepts. The proposed methods are evaluated on the related video databases in comparison with existing sparse representation methods. The experimental results show that the proposed methods significantly enhance the power of discrimination of video features, and consequently improve the accuracy of video semantic concept detection.  相似文献   

17.
In the face of the current huge amount of intelligent traffic data, collecting and statistical processing is a necessary and important process. But the inevitable data missing problem is the current research focus. In this paper, a novel approach of tensor‐based data missing estimation for Internet of Vehicles is proposed for the problem of missing the Internet of Vehicles data: Integrated Bayesian tensor decomposition (IBTD). In the data model construction stage, the random sampling principle is used to randomly extract the missing data to generate a subset of data. And the optimized Bayesian tensor decomposition algorithm is used for interpolation. Introduce the integration idea, analyze, and sort the error results after multiple interpolations, consider the space‐time complexity, and choose the optimal average to get the best result. The performance of the proposed model was evaluated by mean absolute percentage error (MAPE) and root mean square error (RMSE). The experimental results show that the proposed method can effectively interpolate the traffic data sets with different missing quantities and get good interpolation results.  相似文献   

18.
张智  顾韵华 《信息技术》2011,(5):108-111
针对Deep Web的查询需求,提出了一种基于K-近邻算法的Deep Web数据源的自动分类方法。该算法在对Deep Web网页进行表单特征提取及规范化的基础上,基于距离对Deep Web网页所属的目标主题进行判定。实验结果表明:基于K-近邻分类算法可以较有效地进行DeepWeb数据源的自动分类,并得到较高的查全率和查准率。  相似文献   

19.
由于在多传感器测控系统中被测系数与相关参数之间存在着非线性关系,提出了一种基于遗传和最小二乘支持向量机(GA-LSSVM)的多信息融合模型及算法,借助其优越的全局最优搜索能力进行参数的优化。这种方法为小样本、非线性、高维数的多传感器信息融合问题的建模提供了一种有效途径。通过对一个简单的低压负荷电路系统进行算例分析表明,基于最小二乘支持向量机的多传感器信息融合模型及算法在测量准确度和推广性能上都具有一定的优越性。  相似文献   

20.
邹文华  左谛  金开研 《电讯技术》2021,61(4):461-467
为了提高广播式自动相关监视(Automatic Dependent Surveillance-Broadcast,ADS-B)报文质量,解决由于地面站多重覆盖、硬件设施配置、运行状态等原因引起的报文在数据重复性、数据完整性和实时性上存在的问题,采用多条件直接起始法建立航迹,采用多项约束条件筛选进入优选的报文,并基于专家评级法对报文中表征数据项完整性的权重参数进行估计,结合报文的位置精度和完好性参数综合计算得出ADS-B数据质量指标并将其作为挑选依据。对于ADS-B报文质量极度不理想的特殊情况,使用多重插补(Multiple Imputation,MI)算法对其进行补全处理,综合以上步骤挑选出高质量和高可靠性的ADS-B更新点迹。仿真计算证明该方法可有效剔除重复覆盖造成的重复报文和网络延迟造成的历史数据,防止航迹点回跳,提高数据质量和监视效率。目前,该方法已实际应用于地面站和传输链路条件均不理想的场合,大量实践结果表明该方法可用于保证输出高实时性的、周期性的、稳定平滑的、可靠的ADS-B数据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号