首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对将JavaScript代码N-gram处理后识别算法特征维度较高的问题,提出一种高效的降维方法。该方法利用TF-IDF-like模型分别计算特征在正常样本和恶意样本中的权重,基于特征权重在两类样本中的差异度进行降维。基于多个识别算法,将提出的降维方法与基于主成分分析(Principal Component Analysis,PCA)的降维方法进行比较,实验结果表明:当识别算法维度相同时,基于本文所给降维方法的识别算法在识别效果方面优于基于PCA的识别算法;当降维后识别算法的维度超过某个阈值时,随着识别算法维度的增长,本降维方法的时间开销增长速率远低于PCA方法。  相似文献   

2.
利用无监督聚类算法可以有效地保留数据特征的特性,提出采用无监督聚类算法来对数据样本进行降维处理的方法,通过将连续多次迭代分类结果进行按类数编码,得到快速判定聚类分析降维开始的可行条件及聚类结束条件,并以降维数据为数据样本,继续进行聚类分析,快速完成数据特征提取。通过实验证明该方法在数据降维效果和聚类算法的执行速度上都有很大提高。  相似文献   

3.
任永功  林楠 《计算机科学》2009,36(6):188-191
在文本特征选择过程中,针对原始特征空间维数过高、计算量过大、并且存在较大不相关性和冗余性,提出了一种基于动态规划思想的文本特征选择算法(DPFS).首先,结合动态规划思想,基于特征与类别的相关性分析,对原始特征集合进行特征筛选,保留与类别具有强相关性和弱相关性的特征;然后,再次结合动态规划思想,对特征子集做冗余性分析,滤除弱相关且冗余的特征;最后,得到一个近似最优特征子集.实验结果表明,此算法在对数据降维和在降维过程中减少计算量是有效的.  相似文献   

4.
一种适用于小样本问题的基于边界的特征提取算法   总被引:1,自引:0,他引:1  
黄睿  何明一  杨少军 《计算机学报》2007,30(7):1173-1178
特征提取技术是模式识别领域进行数据降维和强化判别信息的有效方法.线性判别分析是监督特征提取方法的典型代表,获得广泛应用,但受到小样本问题的制约.对此提出一种适用于小样本问题的基于边界的特征提取算法.算法利用高维数据小样本情况下线性可分概率增加以及其低维投影趋于正态分布的特点,定义了新的类别边界,不但考虑了由线性判别分析提出的类内、类间离散度,也兼顾各类别的方差差异性.通过极大化该边界获得最优投影向量,同时避免因类内离散度矩阵奇异导致的小样本问题.进一步将算法推广到多类问题.高光谱数据特征提取与分类实验表明,算法在小样本情况下对于两类和多类问题均具有良好的推广性能,优于多种线性判别分析的改进算法,并且在样本较多时也取得了满意结果.  相似文献   

5.
针对肿瘤基因表达谱的特点,提出基于低秩图正则非负矩阵分解(LGNMF)的特征提取方法,解决了NMF算法中缺少数据的全局信息,提升特征提取的有效性。该算法在NMF算法的基础上引入低秩图约束,提高了对数据局部和全局结构的描述,使得经过特征提取后的特征空间具有更强的分类能力。通过LGNMF算法对肿瘤基因表达谱数据集进行降维,获得低维特征空间,再使用KNN分类器对低维特征空间进行分类。通过与NMF、GNMF和RGNMF算法在四组标准肿瘤基因表达谱数据集进行对比,实验结果表明LGNMF算法能够有效提升分类效果。  相似文献   

6.
针对在图像中检测人体目标,提出一种基于Gabor变换和Adaboost算法的检测方法.首先利用二维Gabor小波变换进行特征提取,然后利用Adaboost算法对Gabor特征进行选取并训练强分类器.为了提高检测精度,提出采用单一正样本集合与多个负样本集合分别进行训练,形成多个强分类器级联的层级检测分类器.实验结果表明了该方法的有效性,同时显示该方法须与其它辅助手段相结合,才能提高检测的实时性.  相似文献   

7.
入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归消除(Extra Trees-Recursive Feature Elimination,ET-RFE)和LightGBM(LGBM)的入侵检测方法。首先对网络数据进行独热编码重构,在数据级层面均衡少量样本的攻击类别;其次,使用基于ET-RFE对流量特征进行降维处理,寻找含有信息量最大的最优特征子集;最后,将得到的最优特征子集作为LGBM输入数据集进行分类训练,并利用贝叶斯算法对LGBM参数进行优化。实验采用真实的网络流量数据集UNSW-NB15,通过与随机森林(RF)、XGboost算法和GALR-DT算法比较可得,文章所提方法能够有效提高检测率,并对小样本攻击类型实现有效的召回率。  相似文献   

8.
基于Gabor小波与深度信念网络的人脸识别方法   总被引:1,自引:0,他引:1  
柴瑞敏  曹振基 《计算机应用》2014,34(9):2590-2594
特征提取与模式分类是人脸识别的两个关键问题。针对人脸识别中的高维和小样本问题,从人脸特征的提取与降维算法入手,提出基于受限玻尔兹曼机(RBM)的二次特征提取及降维算法模型。首先把图像均匀分成若干局部图像块并进行量化,再对图像进行Gabor小波变换,通过RBM对得到的Gabor人脸特征进行编码,学习数据更本质的特征,从而达到对高维人脸特征降维的目的;并以此为基础提出基于深度信念网络(DBN)的多通道人脸识别算法。在ORL、UMIST和FERET人脸库上对不同样本规模和不同分辨率的图像进行实验,识别结果表明,与采用线性降维和浅层网络的方法相比,所提方法取得了较好的学习效率和很好的识别效果。  相似文献   

9.
针对人脸识别特征提取阶段中的数据降维方法往往难以兼顾保持全局与局部特征信息的问题,以及匹配识别阶段贝叶斯分类器中小样本问题,提出了一种融合全局与局部特征的贝叶斯人脸识别方法。该方法通过核主元分析提取出人脸数据的全局非线性特征,并在此基础上通过正交化局部敏感判别分析挖掘出人脸数据的局部流形结构信息,以达到提取出具有高判别力低维本质人脸特征的目的;采用一种最大信息量协方差选择的方法,来对协方差矩阵进行估算,以解决贝叶斯分类器设计中的小样本问题。在ORL、AR、 YALE、FLW人脸库上设计实验来进行验证。结果表明,提出的特征提取算法以及对贝叶斯分类器的改进取得了比较好的效果,通过对这两个阶段的优化,可以显著提升人脸识别的效果。  相似文献   

10.
受限于人脸姿态、光照变化等因素,通过引入多通道Gaborface表征结合基于子空间的二维双向线性降维算法,提出了一种结合优化多通道Gaborface与二维线性降维的特征提取算法。首先,采用多通道Gaborface表征(MGFR)模型对样本集进行预处理,提取不同通道下的人脸Gabor特征表示并优化选取通道融合方式而组合成新特征;再引入样本间类别信息获得改进线性二维双向特征降维算法,从而对获得的人脸表示进行特征降维与提取;最终通过最近邻分类器得到分类结果。试验结果表明,通过在AR、ORL和YALE人脸库进行对比分析,改进算法对人脸姿态等变化具有较强的鲁棒性,且较其他算法表现出了较优的识别性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号