首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
基于目前肿瘤基因表达谱数据在医学相关结合行业的广泛普及,运用特征选择算法对其处理成了如今大量学者们的重点研究方向.基于此,提出了一种FCBF-Lasso结合算法.首先,采用FCBF算法对各基因数据集进行特征选择,通过删除冗余的和不相关的特征,得到特征子集;然后,再利用Lasso方法对得到特征子集进行特征选择,进一步地删...  相似文献   

2.
刘云  肖雪  黄荣乘 《信息技术》2020,(5):28-31,36
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。  相似文献   

3.
网络流量特征选择方法中的分治投票策略研究   总被引:1,自引:0,他引:1       下载免费PDF全文
特征选择作为机器学习过程中的预处理步骤,是影响分类性能的关键因素.网络流量具有数据量大,特征维度高的特点,如何快速提取特征子集,并提高分类效率对于基于机器学习的流量分类方法具有重要意义.本文提出基于分治与投票策略的特征提取方法,将数据集分裂为多个子集,分别执行特征提取算法,利用投票方法获得最后的特征子集.实验表明可有效提高特征提取的时间效率,同时使分类器取得良好的分类准确率.  相似文献   

4.
为提升对区块链网络层混合型攻击流量的综合泛化特征感知能力,增强异常流量检测性能,提出一种具有支持异常数据综合判决机制和强泛化能力的基于多分类器集成的区块链网络层异常流量检测方法。首先,为扩大所用基分类器的输入特征子集差异度,提出基于区分度和冗余信息量特征子集选择算法,特征筛选过程中激励高区分度子集项输出,同时抑制冗余信息生成。其次,在Bagging集成算法中引入随机方差缩减梯度算法动态调整各基模型投票权重,提升对混合型攻击流量的检测泛化能力。最后,为了将集成算法输出的低维数值向量向高维空间映射,提出基于数据场概念的局部离群因子算法,并基于数据点间势差放大各样本数据点空间密度分布差异性,提升异常数据点检测召回率。实验结果表明,相较于单一分类检测器集成方法,所提方法的异常检测准确率、召回率分别平均提升1.57%、2.71%。  相似文献   

5.
为提高网络故障诊断系统的诊断精度,节约计算资源,针对需要处理的含有大量无关或冗余特征的数据,提出了一种基于杂交BPSO-SVM的网络故障特征选择算法.该算法采用封装器模式,以SVM的分类准确率和特征压缩比作为适应度函数来指导杂BPSO进行特征选择,将选择出的最优特征子集用于故障诊断.运用Kdd’99数据集的实验结果表明,杂交BPSO-SVM提高了诊断精度,降低了特征维数,可进一步提升网络故障诊断效果.  相似文献   

6.
特征子集搜索是数据挖掘分类任务中一个关键性的难题,常用的过滤器方法忽略了基因之间的相关性,此外,现有的解决方法并不是专门针对处理小样本数据,因此在特征选择方面表现出了不稳定性.为了解决上述问题,在实例学习的基础上提出了一种新型的混合封装过滤算法,并且提出了一种具有封装器评价体系的分类器算法——协同性子集搜索(CSS).选取几个高维小样本的癌症数据集作为数据来源,对提出的评价体系进行了实验测试,结果表明,该方法在准确性及稳定性方面较其他方法表现更好.  相似文献   

7.
基于微粒群算法和支持向量机的特征子集选择方法   总被引:9,自引:0,他引:9  
乔立岩  彭喜元  彭宇 《电子学报》2006,34(3):496-498
在模式分类系统中,大量无关或冗余的特征往往会降低分类器的性能,因此需要特征选择.本文提出了基于离散微粒群(BPSO)和支持向量机(SVM)封装模式的特征子集选择方法,首先随机产生若干种群(特征子集),然后用BPSO算法对特征进行优化,并用SVM的10阶交叉验证结果指导算法的搜索,最后选出最佳适应度的子集对SVM进行训练.两个UCI机器数据集(户外图像和电离层)的实验结果表明了提出算法的有效性.  相似文献   

8.
开放式创新社区高质量用户生成内容特征对企业精准获取技术创新意见具有重要作用。本文构建了开放式创新社区用户生成内容质量多维评价体系,提出一种融合5种算法的特征选择方法,在3种分类模型评估中得出最优特征子集,挖掘重要因素与高质量用户生成内容之间的关系。集成特征子集在模型上计算时间平均节约54.54%,比单一特征选择算法得到的特征子集预测准确率平均提高10.47%。基于多模型融合算法能够客观全面评估开放式创新社区用户生成内容质量,让企业能够精准识别高质量用户生成内容,促进企业开放式创新。  相似文献   

9.
石曼银 《电子测试》2013,(8X):24-25
在传统的手势识别中,多数是通过人工神经网络,隐Markov模型和几何边缘特征等算法。以一种改进的SVM统计向量机算法对手势特征集进行精确识别,通过进行适当函数子集的选择,使判别函数的识别率达到最优,得到一个具有推广泛化能力和最优分类能力学习机,该方法能够保证特征子集的划分的识别效果等价于对整个样本集。通过Kinect进行手势识别测试,结果表明基于改进的SVM向量机手势识别算法具有较好的精确性和准确度。  相似文献   

10.
曹琼  郑红  李行善 《电子学报》2009,37(3):562-566
 针对目标与背景两类图像模式识别问题,在已有的特征选择方法基础上,提出了一种新颖的基于免疫分子编码机理的图像特征选择方法(Immune Antibody Construction Algorithm,IACA).该方法借鉴生物免疫系统的抗体分子编码机理,在对样本进行参数估计情况下,提出熵度量单个特征对于目标和背景的识别敏感度;从集合的角度研究并且定义了特征之间的包含和互补关系;并且基于组成抗体分子氨基酸结合能量最小原则,提出了关于图像目标的免疫抗体构建规则;最终实现了寻找最优特征子集的算法IACA,该特征子集的维数通过算法自动获得无需人为设定,选择结果为目标的"免疫抗体",能很好的从背景中识别目标.利用归纳法证明了用IACA得到的特征子集的最优性.与其他特征选择方法比较,测试结果显示该算法具有较低的计算复杂度和错误识别率,表明了该方法的优越性和先进性.  相似文献   

11.
基于PNN的退化交通标志图像的识别算法研究   总被引:5,自引:0,他引:5  
为了识别退化的交通标志图像,该文采用一种新的特征提取算法。该算法在处理图像退化问题时,采用模糊-仿射联合不变矩直接提取图像的特征,从而避免了需要较大计算量的图像复原处理过程。针对各阶模糊-仿射联合不变矩数量级差异较大问题,提出一种数量级标准化算法。在深入分析PNN与K-means聚类算法的基础上,提出采用全局K-均值算法优化设计概率神经网络分类器,并将其用于交通标志图像的分类识别。仿真结果表明:模糊-仿射联合不变矩是一种有效的处理退化交通标志图像的方法,所设计的概率神经网络分类器不仅具有精简的结构而且具有较好的推广性能。  相似文献   

12.
为有效定位识别和提取网络流量序列的暂态性异常特征,针对网络异常流量特征扰动性和暂态性特点,提出一种基于小波分解的二叉分类回归决策树主分量特征优化跟踪特征提取算法。利用训练集建立决策树模型,采用二叉分类回归决策树模型进行主分量特征优化跟踪建模,利用双正交提升小波分解得到的各层细节信号对暂态性扰动特征的敏感性,通过小波分解得到各层细节信号,将提取的小波分层细节信号的奇异值分解特征再返回到决策树主分量特征优化跟踪模型中,实现网络流量异常特征的定位提取和识别。仿真实验表明,改进算法的抗干扰能力和分辨率提高显著,暂态性异常特征谱图分辨能力提高,异常特征分布谱清晰可见,展示了较好的特征提取和状态识别性能。  相似文献   

13.
深度学习就是机器学习研究的过程,主要通过模拟人脑分析学习的过程对数据进行分析。目前,深度学习技术已经在计算机视觉、语音识别、自然语言处理等领域获得了较大发展,并且随着该技术的不断发展,为网络流量分类和异常检测带来了新的发展方向。移动智能手机与大家的生活息息相关,但是其存在的安全问题也日益凸显。针对传统机器学习算法对于流量分类需要人工提取特征、计算量大的问题,提出了基于卷积神经网络模型的应用程序流量分类算法。首先,将网络流量数据集进行数据预处理,去除无关数据字段,并使数据满足卷积神经网络的输入特性。其次,设计了一种新的卷积神经网络模型,从网络结构、超参数空间以及参数优化方面入手,构造了最优分类模型。该模型通过卷积层自主学习数据特征,解决了传统基于机器学习的流量分类算法中的特征选择问题。最后,通过CICAndmal2017网络公开数据集进行模型测试,相比于传统的机器学习流量分类模型,设计的卷积神经网络模型的查准率和查全率分别提高了2.93%和11.87%,同时在类精度、召回率以及F1分数方面都有较好的提升。  相似文献   

14.
Network traffic classification is a fundamental research topic on high‐performance network protocol design and network operation management. Compared with other state‐of‐the‐art studies done on the network traffic classification, machine learning (ML) methods are more flexible and intelligent, which can automatically search for and describe useful structural patterns in a supplied traffic dataset. As a typical ML method, support vector machines (SVMs) based on statistical theory has high classification accuracy and stability. However, the performance of SVM classifier can be severely affected by the data scale, feature dimension, and parameters of the classifier. In this paper, a real‐time accurate SVM training model named SPP‐SVM is proposed. An SPP‐SVM is deducted from the scaling dataset and employs principal component analysis (PCA) to extract data features and verify its relevant traffic features obtained from PCA. By employing PCA algorithm to do the dimension extraction, SPP‐SVM confirms the critical component features, reduces the redundancy among them, and lowers the original feature dimension so as to reduce the over fitting and increase its generalization effectively. The optimal working parameters of kernel function used in SPP‐SVM are derived automatically from improved particle swarm optimization algorithm, which will optimize the global solution and make its inertia weight coefficient adaptive without searching for the parameters in a wide range, traversing all the parameter points in the grid and adjusting steps gradually. The performance of its two‐ and multi‐class classifiers is proved over 2 sets of traffic traces, coming from different topological points on the Internet. Experiments show that the SPP‐SVM's two‐ and multi‐class classifiers are superior to the typical supervised ML algorithms and performs significantly better than traditional SVM in classification accuracy, dimension, and elapsed time.  相似文献   

15.
随着城市交通智能化发展,准确高效地获取可用车位对于解决日益严峻的停车难问题至关重要。该文提出一种基于非局部操作的深度卷积神经网络车位占用检测算法。针对停车位图像特性,引入非局部操作,度量远距离像素间的相似性,直接获取边缘高频特征;使用小卷积核获取局部细节特征;以端到端的方式训练网络。实验中,通过设置不同卷积核尺寸和非局部模块层数,优化网络结构。实验结果表明,该文所提算法与传统的基于纹理特征的车位占用检测算法相比,无论在预测精度还是模型的泛化性能,均具有显著的优势。与当前广泛应用的基于局部特征提取的卷积神经网络相比,该算法具有较大的优势。在真实场景中,该算法同样具有较高精度,具备实际应用价值。  相似文献   

16.
Regardless of the developments of networking and communication technologies, security is without exception a predominant feature to ensure network reliability. The future sixth-generation (6G) network is anticipated to be carried out with artificial intelligence (AI) powered communication via machine learning (ML), post-quantum cryptography, and so on. AI-powered communication has been in recent years utilized in enhancing network traffic performance with respect to resource management, optimal frequency spectrum design, security, and latency. The studies of modern wireless communications and anticipated features of 6G networks revealed a prerequisite for designing a trustworthy attack detection mechanism. In this work, a method called, Luong Attention and Hosmer Lemeshow Regression Window-based (LA-HLRW) attack detection in 6G is proposed. Initially, with the raw Botnet Attack dataset obtained as input, preprocessing is performed to normalize network traffic features. Next, the dimensionality of network traffic feature of large-scale network traffic data is reduced using the Luong Attention integrated with Long Short Term Memory (LSTM)-based Feature extraction model. Finally, with the objective of classifying network traffic samples for attack detection in 6G, we analyze the low dimensional network traffic feature set produced by Luong Attention integrated with LSTM using the Hosmer Lemeshow Logistic Regression Window-based Attack Detection model. Extensive experiments are performed with the Botnet Attack dataset to validate the efficiency of the proposed LA-HLRW method by using different parameters such as attack detection accuracy, attack detection time, precision, and recall. The overall analysis of proposed LA-HLRW results significantly reduced the attack detection time by 24%, and additionally improved attack detection accuracy, precision, and recall by 5%, 5%, and 6% as compared to existing attack detection methods respectively.  相似文献   

17.
姚旭 《现代导航》2018,9(2):109-113
卫星导航系统监测站主要负责卫星定位跟踪、采集、记录和将数据传输到数据中心。为了保障数据的有效性和安全性,必须对数据进行加密后才能传输。面对越来越复杂的网络环境,如何精确,高效,实时地识别出网络加密流量,从而进一步检测出卫星导航加密数据,成为了一个具有挑战性的问题。本文针对加密协议未知,以及网络负载未知的网络加密流量,首先通过分析数据包首部信息,提取出了一组特征属性集——PBF特征集,用于机器学习模型的构建,然后提出了一种以AdaBoost-C4.5算法作为分类器的网络加密流量检测模型,最后通过机器学习方法自动检测加密流量。通过实验验证,该模型在准确率和稳定性上有较好的表现。  相似文献   

18.
随着地铁乘客的大量增加,实时准确地监测地铁站内客流量对于保证乘客安全具有重要意义。针对地铁场景复杂、行人目标小等特点,该文提出了多尺度加权特征融合(MWF)网络,实现地铁客流量的精准实时监测。在数据预处理阶段,该文提出过采样目标增强算法,对小目标占比不足的图片进行拼接处理,增加小目标在训练时的迭代频率。其次,在单镜头多核检测器(SSD)网络基础上添加了基于VGG16网络的特征提取层,将不同尺度的特征层以不同方式进行加权融合,并选出最优的特征融合方式。最终,结合小目标过采样增强算法,得到多尺度加权特征融合模型。实验证明,该方法与SSD网络相比,在保证实时性的同时,检测精度提升了5.82%。  相似文献   

19.
车联网中车辆以自组织的方式相互报告交通信息,开放的网络环境需要甄别消息,然而,要快速移动的车辆在短时间内检测出大量的交通警报信息是非常困难的。针对这一问题,提出一种基于弱分类器集成的虚假交通信息检测方法。首先,扩充交通警报信息的有效特征,并设计分割规则,将信息的特征集划分为多个特征子集;然后,根据子集特征的不同特性,使用对应的弱分类器分别进行处理。仿真实验和性能分析表明,选用弱分类器集成方法检测车联网中的虚假交通信息减少了检测时间,且由于综合特征的应用,检测率优于仅使用部分特征的检测结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号