首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 655 毫秒
1.
现代社会环境下机电职业学习者特征与其他学科学习者特征存在着显著差别,为了对机电职业学习者属性特征进行智能预测,提出一种结合SVM与优化KNN的算法模型。该模型首先对传统KNN模型进行加权来应对处理数据时的不均衡问题;在此之后结合SVM算法和加权KNN算法各自的优点对机电职业学习者样本进行分类,即距离超平面分类较远距离的学习者样本选择SVM算法,较近距离的则采用加权KNN算法。实验结果表明,融合各自优点的SVM-KNN算法具有更高的数据分类准确率,对机电职业学习者的属性特征分类和预测具有较好的适用性。  相似文献   

2.
KNN文本分类算法是一种简单、有效、非参数的分类方法。针对传统的KNN文本分类算法的不足,出现了很多改进的KNN算法。但改进的KNN分类算法大多数是建立在样本选择的基础上。即以损失分类精度换取分类速度。针对传统的KNN文本分类算法的不足,提出一种基于特征加权的KNN文本分类算法(KNNFW),该算法考虑各维特征对模式分类贡献的不同,给不同的特征赋予不同的权值,提高重要特征的作用,从而提高了算法的分类精度。最后给出实验结果并对实验数据进行分析得出结论。  相似文献   

3.
本文主要对LSTM模型结构改进及优化其参数,使其预测股票涨跌走势准确率明显提高,同时对美股周数据及日数据在LSTM神经网络预测效果展开研究.一方面通过分析对比两者预测效果差别,验证不同数据集对预测效果的影响;另一方面为LSTM股票预测研究提供数据集的选择建议,以提高股票预测准确率.本研究通过改进后的LSTM神经网络模型使用多序列股票预测方法来进行股票价格的涨跌趋势预测.实验结果证实,与日数据相比,周数据的预测效果表现更优,其中日数据的平均准确率为52.8%,而周数据的平均准确率为58%,使用周数据训练LSTM模型,股票预测准确率更高.  相似文献   

4.
《信息与电脑》2019,(17):20-22
KNN是比较成熟的分类算法,关于KNN手写数字识别的分类应用实战很多都是基于sklearn提供的手写数字识别数据集traningDigits。笔者结合KNN算法原理用Python实现其手写数字识别的算法过程,并支持用户用拍照、绘图软件手写数字,方法就是将图片处理成sklearn提供的数据集格式,然后作为测试样本应用在分类模型中进行预测,经过运行验证算法分类效果良好。  相似文献   

5.
数据预测在金融投资领域占有重要地位,而股票价格是金融数据中最复杂的数据类型之一。本文将文化算法应用于股票指数建立时间序列模型,并且针对股票数据的特点,选择适应股票规律的文化算法模型,并与线性回归算法得到的数据结果进行了对比分析,以此来分析文化算法在该问题应用上的优劣。实验结果表明,利用文化算法模型进行预测取得了较好的结果,其预测精度较高,预测的相对误差在3%以内,涨跌分析正确率在70%以上。  相似文献   

6.
基于支持向量机和k-近邻分类器的多特征融合方法   总被引:1,自引:0,他引:1  
陈丽  陈静 《计算机应用》2009,29(3):833-835
针对传统分类方法只采用一种分类器而存在的片面性,分类精度不高,以及支持向量机分类超平面附近点易错分的问题,提出了基于支持向量机(SVM)和k 近邻(KNN)的多特征融合方法。在该算法中,设样本集特征可分为L组,先用SVM算法根据训练集中每组特征数据构造分类超平面,共构造L个;其次用SVM KNN方法对测试集进行测试,得到由L组后验概率构成的决策轮廓矩阵;最后将其进行多特征融合,输出最终的分类结果。用鸢尾属植物数据进行了数值实验,实验结果表明:采用基于SVM KNN的多特征融合方法比单独使用一种SVM或SVM KNN方法的平均预测精度分别提高了28.7%和1.9%。  相似文献   

7.
粒子群算法和K近邻相融合的网络入侵检测   总被引:1,自引:0,他引:1  
为了提高网络入侵检测效果,提出一种粒子群优化算法(PSO)和K最近邻相融(KNN)的网络入侵检测模型(PSO-KNN)。首先特征子集和KNN参数作为一个粒子,然后通过粒子之间的信息交流和相互协作,找到最优特征子集和KNN参数,从而建立最优网络入侵检测模型,最后利用KDD 1999数据集对模型性能进行测试。结果表明,相对于其他入侵检测算法,PSO-KNN更有效地精简网络数据特征,提高分类算法的网络入侵检测速度及检测率。  相似文献   

8.
滚动轴承的故障诊断对于提高工业生产效率,保障工业生产的稳定安全地运行具有重要意义。为了提高滚动轴承故障识别的正确率,提出一种使用KNN-朴素贝叶斯决策组合算法对滚动轴承故障诊断。组合算法利用朴素贝叶斯算法对使用不同K值的KNN算法初步分类结果进行再分类以达到提高滚动轴承故障识别的目的。首先,使用小波包能量法对滚动轴承振动信号进行能量特征提取,然后使用多个参数K值不同的KNN算法对能量特征数据预分类,得到多个KNN算法分类结果集,将分类结果集进行处理得到预分类结果集,将预分类结果集作为朴素贝叶斯算法的输入,使用朴素贝叶斯算法对数据再分类。实验结果表明,组合算法相较于传统KNN算法及贝叶斯算法在滚动轴承的故障诊断率得到了有效提高,实现了对滚动轴承故障的有效诊断。  相似文献   

9.
首先应用模糊聚类方法将数据分类,以相邻两个聚类中心的中点作为子区间的分界点来划分论域,并以此将时间序列模糊化为模糊时间序列;其次根据证券市场主要量价指标建立了具有多个前件的高阶模糊关系;最后将该模型用于上证股票综合指数和深证股票成分指数的多步预测和涨跌趋势预测。与典型模糊时间序列模型比较,涨跌趋势预测准确率有较大提高,多步预测结果表明模型具有较好的泛化能力。  相似文献   

10.
KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征、简单算法精度特征、复杂度特征等构建特征向量,然后利用线性回归、神经网络等方法建立特征向量与最优K值之间的预测模型,并用该模型预测新数据集的最优K值。在UCI数据集上的实验表明,该方法能迅速预测最优K值,并确保一定的精度。  相似文献   

11.
针对传统的基于统计学的回归股票预测模型难以表征多个变量之间的关系,预测出的股票价格趋势误差较大,提出一种基于经验模态分解(EMD)与投资者情绪的长短期记忆(LSTM)神经网络股票价格涨跌预测模型。首先,将股票收盘价通过EMD分解得到若干个具有不同时间尺度的局部特征信号的本征模函数(IMF);其次,通过引入改进的股票领域情感词典,对东方财富网股吧的帖子,进行上一个股票交易日收盘后和下一个股票交易日开盘前的投资者情感分析,得到下一个股票交易日的投资者情绪指标;最后,将基础的股票基本行情数据、经过EMD得到的IMF以及投资者情绪指标加入LSTM神经网络预测下一个交易日的股票涨跌。仿真实验结果表明,在2019年1月至2021年9月的牧原股份(002714)股票数据上,与单独使用LSTM模型相比,改进后的LSTM模型的预测准确率提高了12.25个百分点,在预测为涨的F1值和预测为跌的F1值上分别提高了1.2个百分点和25.21个百分点。由此可见,基于EMD与投资者情绪的LSTM股票价格涨跌预测模型有效提高了预测精度,为股票市场的涨跌预测提供了一种有效的实验方法。  相似文献   

12.
传统的KNN文本分类算法在处理不均匀数据时,尤其是小型数据,容易受到边缘数据的干扰,导致分类效果明显下降.对此,本文提出一种基于模糊理论的KNN文本分类算法,该算法根据模糊理论的思想计算样本的隶属度函数,更合理地处理训练样本权值.实验表明,基于模糊理论的KNN算法能有效的弱化这些干扰,并在分类准确度上也有一定的提高.  相似文献   

13.
深度学习技术在数字识别领域有着普遍的应用。通过深度学习技术构造神经网络模型,运用不同的激活函数搭配不同的参数初始化策略,对MINIST手写数据集进行训练;构建分析模型,识别图像中的数字,将大数据量的图片降维成小数据量图片,同时保证能够有效保留图片特征;通过对图片数据的分析,加入特征转换过程,利用梯度下降优化器,搭建网络结构,将数据降维,有效地避免过拟合;利用交叉熵验证对模型进行编译和训练,对输出的分类结果进行进一步分析,在Sigmoid激活函数的输出层,通过K最近邻分类算法,设置KNN分类器,进一步提高了分类预测的准确率。MNIST数据集上的实验结果显示识别率为96.2%,在输出层引入K最近邻算法KNN(K-Nearst Neighbors)结合传统卷积神经网络(Convolutional Neural Network, CNN)的全连接层与softmax层,经交叉验证得到99.6%的识别率。  相似文献   

14.
本文通过研究KNN(K-最近邻)算法在疾病预测领域的使用与分析,总结出KNN的2点不足,针对不足进行相应改进并提出F_KNN(循环最近邻搜索)算法:1)针对KNN计算量大、效率低下的缺点,本文采用FLANN(快速最近邻搜索)循环搜索与待测样本距离最近的点,记录若干个最近邻点作为最近邻点子集,利用此子集取代全集对待测样本进行计算,可以降低计算量,极大地提高了KNN算法效率;2)针对KNN难以对高维数据集分类的缺点,本文采用AHP(层次分析法)对样本的特征属性进行相关性研究,使用合适的参数分配权重,提高了KNN算法准确率。本文采用一组脑中风数据集对优化后的算法进行实验,实验结果表明,F_KNN准确率达96.2%。与传统KNN相比,F_KNN提高了分类性能且极大地提高了算法效率。在处理高维且较大的数据集时,F_KNN算法优势明显,具有较好的应用前景。  相似文献   

15.
恐怖主义被称为现代人类社会之癌,是世界各国政府和人民面临着的重大的挑战,应该引起全人类的重视。在使用全球恐怖主义数据库中的数据对恐怖主义活动进行研究时,从高维数据中提取关键的特征,是反恐研究中的重点和难点。针对全球恐怖主义数据库中特征的高维性、冗余性和数据不完整性的特点,分别采用最小冗余最大相关算法(mRMR)、基于支持向量机的递归删除算法(SVM-RFE)和基于随机森林的特征选择算法进行特征筛选与提取。利用K-近邻(KNN)分类器其对上述特征选择方法进行降维结果分析和分类结果比较。实验结果表明,特征选择算法不仅能提高分类性能还能提高分类效率,并且基于支持向量机的递归删除算法(SVM-RFE)选择的特征子集在预测恐怖主义活动时准确率更高。  相似文献   

16.
Deep Web自动分类是建立深网数据集成系统的前提和基础。提出了一种基于领域特征文本的Deep Web分类方法。首先借助本体知识对表达同一语义的不同词汇进行了概念抽象,进而给出了领域相关度的定义,并将其作为特征文本选择的量化标准,避免了人为选取的主观性和不确定性;在接口向量模型构建中,考虑了不同特征文本对于分类作用的差异,提出了一种改进的W-TFIDF权重计算方法;最后采用KNN算法对接口向量进行了分类。对比实验证明,利用所提方法选择的特征文本是准确有效的,新的特征文本权重计算方法能显著地提高分类精度,且在KNN算法中表现出较好的稳定性。  相似文献   

17.
卜钰家 《现代计算机》2022,(22):37-41+46
金融市场中的股票价格具有波动性和复杂性,而如今传统模型很难有效进行股价预测。选取上证指数作为数据集,提出了BP-LSTM模型和ARIMA-LSTM模型这两种混合模型,BP-LSTM模型利用BP模型提取数据中的非时序信息,再用LSTM模型提取数据中的时序信息的优点。ARIMA-LSTM模型中ARIMA模型可以利用数据中的线性信息,而LSTM模型适合提取数据中的非线性信息。为了证明模型的可行性,建立了LSTM模型,BP模型和ARIMA模型来进行对比,得出ARIMA-LSTM的预测效果好过其他的模型,BP-LSTM预测股价效果不好,但更适合做分类来预测股票涨跌。  相似文献   

18.
以股票涨跌趋势预测精度为评价指标,针对传统股票数据特征训练过程中预测精度不高的情况,考虑引入两种不同的向量化策略对股民评论、新闻关键词等文本信息进行非结构化数据特征的捕捉,利用词意的积极、消极程度对客观因素进行处理,进而将向量化后的特征作为新的非线性特征项扩充原有的结构化特征集合。文中分别以词向量化和句向量化为出发点设计两种启发式的SVM分类器,其目标是在拟合每支股票的情况下尽可能预测出其未来的走势,挖掘出更具有增长潜力的股票样本。经过2018年6月至12月半年沪市股票数据集的实验结果表明,相比于词向量化策略,采用句向量化策略设计的SVM分类器不仅能够更好地预测股票涨跌,并且能够更有效地挑选出潜在增长的股票样本。  相似文献   

19.
周靖  刘晋胜 《计算机应用》2011,31(7):1785-1788
特征参数分类泛化性差及分类计算量大影响着K近邻(KNN)的分类性能。提出了一种降维条件下基于联合熵的改进KNN算法,其具体思路是,通过计算任意两个条件属性下对应的特征参数的联合熵衡量数据特征针对分类影响程度的大小,建立特征分类特性与具体分类过程的内在联系,并给出根据特征联合熵集约简条件属性的方法。理论分析与仿真实验表明,与经典KNN等算法相比,提出的算法具有更高的分类性能。  相似文献   

20.
用于大数据分类的KNN算法研究   总被引:3,自引:0,他引:3  
针对KNN算法在处理大数据时的两个不足对其进行了研究,提出多层差分KNN算法。算法对已知样本根据类域进行分层,既避免了传统改进算法中剪辑样本带来的判别误差,又大大降低了无效的计算量;同时在最后一层采用差分的方法进行决策,而不是直接根据最近邻进行分类,大大提高了分类的准确性。实验结果表明,该算法在对样本容量大、涉及邻域多的大数据样本进行分类时能取得较好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号