首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对传统的钓鱼站点攻击检测模型时延高、效率低、特征提取复杂的问题,提出一种使用长短期记忆网络(long short term memory,LSTM)和随机森林的混合算法模型。该模型主要包括网址上下文特征提取和混合特征分类两部分。首先,根据循环神经网络特点建立128步长的深度网络结构。实验数据参考开源社区提供的钓鱼网站网址和正常网址情报。利用自然语言处理技术对网址数据进行编码得到具有局部特征的网址序列。通过构建的LSTM网络对网址序列进行字符上下文特征提取,结合传统检测方法中的非字符序列特征,共同构成实验特征集。随后,利用随机森林获取每一个特征的最佳分裂点,构建混合特征分类模型。该模型以网址数据为检测源,一方面降低了随机森林的字符序列特征维度,另一方面结合传统钓鱼网址检测中的非序列特征,弥补了LSTM算法检测特征单一的问题。为验证该模型的有效性,设计了本文模型与随机森林算法、LSTM算法的对比实验,并进一步对不同LSTM训练规模的时间成本进行分析。从实验中发现,基于LSTM与随机森林的混合模型大幅度提高了钓鱼网站的识别准确率,模型准确率达到98.52%,比相同训练规模的LSTM准确率高3%,比实验中的单一随机森林准确率高7%。同时,相比于LSTM算法同等幅度的准确率提升,该混合算法具有更小的时间代价。实验结果表明,作者提出的混合模型克服了传统识别模型在特征提取、识别效率上的问题,适合于海量钓鱼网站攻击的快速识别。  相似文献   

2.
为预测用户的购买行为,本文提出了一种基于LSTM与随机森林相结合的预测模型。该模型不仅对用户的行为数据进行量化提取特征和商品的属性提取特征,同时结合LSTM对序列数据处理的优势,将用户的行为数据作为先后关联的序列进行动态特征提取,再结合随机森林对用户的购买行为进行预测,最后采用某商城真实的商品月销售数据进行实验验证。研究结果表明,该基于动态特征的组合模型精确率达到了98%以上,比单一的随机森林模型采用静态特征预测有较大提高,同时召回率和正确率也有所提高。该模型为用户购买行为的预测提供了有效方法。  相似文献   

3.
针对当前基于流特征的流量识别方法准确率较低的问题,提出一种基于互信息的P2P流量特征选择方法和基于该方法的随机森林技术在流量识别中的应用模型,将网络流数据流分为P2P流和非P2P流。实验证明,该方法具有较高的识别率,说明了采用随机森林技术进行P2P流量识别的有效性。  相似文献   

4.
针对当前Android恶意软件检测方法对检测出的恶意行为无法进行识别和分类的问题,提出基于随机森林(RF)算法的Android恶意行为的识别与分类方法. 该方法在对Android恶意软件的类型进行定义的基础上,利用融合多种触发机制的Android恶意行为诱导方法触发软件的潜在恶意行为;通过Hook关键系统函数对Android软件行为进行采集并生成行为日志,基于行为日志提取软件行为特征集;使用随机森林算法,对行为日志中的恶意行为进行识别与分类. 实验结果表明,该方法对Android恶意软件识别的准确率达到91.6%,对恶意行为分类的平均准确率达到96.8%.  相似文献   

5.
为了提高以人体轮廓为主要特征对人体行为进行识别时的性能,提出一种以头部为基准的人体轮廓模型.采用无需重新初始化的level set方法提取视频序列图像中的人体轮廓,将人体轮廓纵横比最小的帧确定为关键帧.根据欧式距离局部极大原则确定关键帧中轮廓上的人体端点(头、手、脚等),通过肤色模型确定头部位置并作为轮廓标记的基准点,建立以头部为基准的人体轮廓模型.基于该模型提取特征,采用支持向量机(SVM)对人体行为进行识别.以WEIZMANN数据库为对象的行为识别实验结果验证了该模型和行为识别方法的有效性.  相似文献   

6.
提出了一种基于模型融合的声效检测方法.首先提取对所有声效模式都具有良好辨识能力的谱信息熵特征,并进行声效辨识度分析;然后引入互补模型进行声效识别,从模型层面实现了整体谱特征、梅尔频率倒谱系数和谱信息熵的融合.对孤立词测试集进行了声效检测实验,识别精度为81.6%,实验结果表明,谱信息熵在3类特征中具有最好的分类能力,而互补模型能够有效集成3种特征蕴含的显著性信息.  相似文献   

7.
微博文本语法不规范且多由短语组成,严重影响了现有针对规范、长句文本设计的命名实体识别算法的性能.针对上述问题,本文提出了一种融合词性信息的微博文本命名实体识别模型.该模型通过分词工具提取词性信息,将词性信息作为特征与单词嵌入向量结合后输入双向长短期记忆神经网络,最后使用条件随机场对神经网络输出进行解码,从而实现词性特征辅助命名实体识别.实验结果表明,融合词性信息的命名实体识别模型,显著提高了微博文本命名实体识别的准确率.相比于其它模型,该模型F1值提高了1. 88%.  相似文献   

8.
特征融合技术综合了参与融合的多类特征的有效鉴别信息,使得合成的新特征向量具有更强的分类能力.将提取到的唇形区域的几何特征向量和由离散余弦变换描述子表述的唇形轮廓特征向量进行特征融合,形成新的特征向量,应用隐马尔可夫模型进行特征向量的学习和识别,从而综合利用两类特征的鉴别信息,提高唇形识别的效果.实验研究了45°视角下的唇形识别,基于独立汉字发音的实验结果表明,综合两类特征所形成的新特征向量比单纯采用任何一种特征向量都能够提高唇形识别的效果.  相似文献   

9.
准确识别驾驶员的分心行为能够从源头上减少交通事故的发生。传统的识别方法类别少,准确率不高,对此,引入并改进残差神经网络(ResNet-50)对驾驶员分心行为进行识别。为了进一步提高模型特征的提取能力,从改进后的ResNet-50和EfficientNet-B0模型中提取特征,并将其双线性融合,从而进一步提高模型的识别准确率。通过对正常驾驶、玩手机、打电话、喝水、向后座拿东西、与副驾交谈6种驾驶员的行为进行测试,改进后ResNet-50模型的平均识别准确率达94.2%。将改进后的ResNet-50与EfficientNet-B0模型进行融合,融合模型的平均识别准确率高达96.7%。实验结果表明,该方法对驾驶员分心行为的检测有较好的分类效果。  相似文献   

10.
为分析病理人群与正常人群的发音差异性,提出一种结合语音融合特征和随机森林的语音识别方法来进行正常语音与构音障碍语音的分类识别,从而为医学诊断和治疗提供科学和客观的依据.首先,使用多伦多大学开发的病理语音数据库,提取出语音的五种韵律特征以及梅尔频率倒谱系数,再计算其统计特征,构成融合特征,最后结合随机森林算法进行分类识别.结果显示,相比于单一类型特征,提出的融合特征在识别性能上有着显著优化作用,与随机森林分类器结合后,对于男性声音的分类准确率达到99.21%,对于女性声音的分类准确率达到98.97%,综合分类准确率达到98.00%.同时研究还发现,相较于句子,患者对短语的发音更为准确.  相似文献   

11.
主要阐述了决策树学习算法在交通方式选择模型中的应用.在基本决策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型,以Bagging预测方法和CART算法为主,以随机特征选择和"投票"方法为辅,并相互融合,结合具体实例详细介绍该模型的建立,从数据的选择到整个森林中树的数目和每个结点处抽取的候选属性的个数调整,并对模型进行了相应的评估.实验结果表明,随机森林预测精度高,且对噪声数据具有较强的稳健性,采用决策树学习算法得出的规则在交通方式选择的分析中具有较好的实用价值.  相似文献   

12.
车辆在执行换道行为时,由于受到较多环境因素影响,难以准确进行换道识别和预测. 为解决这一问题,提出一种基于梯度提升决策树(GBDT)进行特征变换的融合换道决策模型,以仿真驾驶员在高速公路上自由换道时的决策行为. 采用主体车辆与目标车道后车的碰撞时间 tlag 及车辆周围交通状态变量进行车辆换道行为的建模分析,在NGSIM数据集上对建立的融合换道决策模型进行参数标定和模型测试. 实验结果表明:融合换道决策模型以95.45%的预测准确率超越支持向量机、随机森林和GBDT等单一的换道决策模型,获得了最突出的表现. 变量分析结果表明:新引入的换道决策变量 tlag 对车辆换道行为具有重要影响. 提出的融合换道决策模型能够进一步减少因换道决策误判而导致的交通事故.  相似文献   

13.
特征融合方法是模式识别领域的一种重要方法.计算机视觉领域的图像识别问题作为一种特殊的模式分类问题,仍然存在很多挑战.特征融合方法能够综合利用多种图像特征,实现多特征的优势互补,获得更加鲁棒和准确的识别结果.笔者基于信息融合理论分析了特征融合方法的原理,介绍了特征融合方法的研究现状,讨论了特征融合与3类主流基础理论相结合的方法,其中基于贝叶斯理论的特征融合算法可以实现多特征的融合决策,基于稀疏表示理论的特征融合算法能够得到多特征的联合稀疏表示,基于深度学习理论的特征融合算法能够强化深度神经网络模型的特征学习过程.  相似文献   

14.
为构造有效的情感识别系统,通过声音刺激分别诱发出高兴、悲伤、生气以及中性4种情感,并采集相应的语音信号和脑电信号。首先,利用相空间重构技术提取脑电信号和语音信号的非线性几何特征和非线性属性特征,并结合两者的基本特征分别实现情感识别;然后,通过构建基于限制玻尔兹曼机的特征融合算法,从特征层融合的角度实现多模态情感识别;最后,利用二次决策算法从决策融合的角度构建多模态情感识别系统。实验结果显示,从特征融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高1.08%和2.75%;从决策融合的角度构建的多模态情感识别系统相比语音信号和脑电信号情感整体识别率,分别提高6.52%和8.19%;决策融合相比特征融合构建的多模态情感识别系统整体识别效果更优。因此,融合语音信号和脑电信号等不同来源的情感数据可以构造出更有效的情感识别系统。  相似文献   

15.
针对目前行为识别通用模型对步行、上楼、下楼等易混淆行为识别准确率较低的情况,提出了一种基于小波分解的移动用户行为识别方法,从小波分解后不同频率子信号的低频近似系数中提取小波能量、小波峰个数和平均波峰幅值等特征,基于决策树分类器建立与用户无关的行为识别通用模型. 分别用典型时域特征数据集和小波特征数据集对该通用模型进行验证. 实验结果表明,采用新方法后,3种易混淆行为的平均识别准确率提高了14.82%,减少了误判.  相似文献   

16.
提出一种基于ReliefF算法的时频联合特征及随机森林的配电网电缆故障识别方法. 针对零序电压,从时域和频域构造23个故障敏感特征,采用ReliefF算法进行特征选择,得到最具分类能力的特征子集. 将特征子集作为基于随机森林的输入进行训练,得到最终的分类模型,实现了电缆故障类型识别. 所提方法与基于单一特征的方法相比,能够更加充分地挖据数据潜力,同时由于采用ReliefF算法筛除了无关特征,提高了算法效率. 最后采用Matlab软件进行仿真,并与决策树、KNN、SVM等算法进行比较,仿真结果验证了所提方法的可行性和高准确性.  相似文献   

17.
由于运动想象脑电信号的信噪比较低,特征提取和特征选择比较困难,无法获得较高的分类准确率。针对上述问题,该文提取了时域、频域和空间域3个观察面的特征,并采用粒子群优化算法结合随机森林分类器来进行特征筛选。具体过程为,首先根据R2图来对信号进行带通滤波;其次,使用小波软阈值和得分共空间模式算法进行去噪和通道筛选;然后,通过3种算法提取时频域和空间域特征,待特征融合之后使用基于随机森林分类器的评价指标作为PSO的适应度函数,进行特征选择;最后,运用3种分类器以及集成分类器来验证效果。实验结果显示,通过特征融合以及特征选择可以去除冗余信息,保留有效信息,最终的分类正确率达到98.3%,为该技术在医疗康复等领域应用提供了新的方法。  相似文献   

18.
针对传统单帧字符图像重建方法存在分辨率较低的问题,提出了一种增强重建单帧字符图像分辨率的方法.首先,构建单帧字符图像重建的三维轮廓特征检测模型; 其次,采用边缘轮廓分割法提取单帧字符图像的三维细节特征,并结合小波多尺度分解法实现尺度特征分离; 然后,采用小波阈值去噪法对图像进行滤波降噪,并使用非负邻域嵌入的方法增强小波阈值辨识度,以此构建增强重建单帧字符图像分辨率的模型,完成单帧字符图像的高分辨率重建.最后,以Matlab 2013软件为实验平台进行仿真测试显示,采用本文方法得到的重建图像的清晰度明显优于文献[2-4]方法,且平均峰值信噪比(26 dB)也显著优于文献[2](15 dB)、文献[3](10 dB)、文献[4](16 dB)的方法.因此,本文方法在车牌号码识别、基于内容的图像检索、文档图像分析等领域中具有较好的应用价值.  相似文献   

19.
提出了一种快速识别阿拉伯数字0~9的算法,用于飞机仪表参数的识别。这种算法基于二值图像,先从二值图像中找出各数字的特征,然后再用决策树对这些数字进行分类。该方法不需对图像进行如细化、轮廓跟踪等处理,节省了大量图像处理时间,具有较高的识别速度,因而可用于实时识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号