首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
实时网络数据包含大量冗余术语和噪声,而现有入侵检测技术准确度较低,特征提取能力不足。针对NSL-KDD数据集,提出了一种基于决策树的网络入侵检测系统。采用相关特征选择子集评价方法进行特征选择并减小维数,消除冗余数据,提高资源利用率并降低时间复杂度,通过特征选择可提高入侵检测方法预测性能。在特征选择之前和特征选择之后,对五类分类和二类分类进行性能评估。结果表明,该系统具有较高检出率和精度,数据集二类分类总体结果高于五类分类,可为网络安全检测工作提供借鉴。  相似文献   

2.
针对卷烟近红外光谱高噪和高冗余特点,提出了一种基于随机森林(RF)和主成分分析(PCA)的特征优选方法RF-PCA,建立了5种不同质量级别卷烟的分类模型,并和其他方法进行了比较。该方法能够有效地对高维数据样本进行分类,用于甄别卷烟品质真伪。特征选择可以过滤与分类不相关的特征,而通过PCA方法可以消除冗余特征的不良影响,并可进一步降低特征维数。实验表明:RF-PCA方法能有效地剔除近红外光谱数据中的噪声特征和冗余特征,提高了分类效率。  相似文献   

3.
垃圾网页(Web Spam)的大量存在严重降低了搜索引擎的检索效率。针对垃圾网页内容特征、链接特征的高维性及特征属性间的冗余性,本研究先对垃圾网页数据集中具有较高相关度的关联属性进行分组主成分分析(PCA),并选取最高贡献率的第一主成分的主要属性,从而减少冗余。再使用支持向量机(SVM)分类模型对处理后的数据集进行分类实验。实验结果表明,本文提出的方法可有效提高SVM对垃圾网页的分类性能。  相似文献   

4.
在线流特征选择通过实时过滤无关特征和冗余特征,实现流特征空间降维.针对已有算法,如Alpha-investing分类精度低、SAOLA选择特征数多和OSFS在低冗余高相关数据集下运行时间长的问题,提出了一种面向分类的流特征在线特征选择算法——OSFIC.算法运用四层过滤框架,通过无条件独立过滤不相关新特征、单条件下互信息过滤冗余新特征和候选特征集合中的部分冗余特征,最后通过多条件独立过滤候选特征集中的剩余冗余特征,最终得到分类标签的近似马尔可夫毯.为了分析OSFIC的性能,选择了NIPS 2003和Causality Workbench中的数据集,从预测精度、特征数量、运行时间和AUC方面与已有基准算法进行比较.实验表明,OSFIC平均分类精度比Alpha-investing提升4.41%.在保证精度的前提下,平均特征数量比SAOLA减少41.9%,运行时间比OSFS减少91.59%.最后,在真实的应用场景下验证了OSFIC的有效性.  相似文献   

5.
针对现有的图像分类学习方法无法对特定对象的分类识别任务进行特征选取的不足,提出了利用异构特征组进行选取的方法,使用水墨画低阶视觉特征对水墨画进行分类识别。该算法首先提取图像中低阶异构特征去描述水墨画独特艺术风格,确定水墨画高阶语义特征和低阶异构特征的对应关系;改进Lasso模型可提取异构特征子集中最可体现此画家典型艺术风格的特征,实现水墨画低阶异构特征和不同作者艺术风格之间的映射关系。采用异构特征组可获得水墨画艺术风格特征信息并对其进行分类识别。实验结果表明,与SVM、Lasso方法相比,该方法能有效地提取异构特征组信息,可以获得水墨画艺术风格深度信息,并能够取得较好的水墨画分类识别性能,提高识别率和鲁棒性,实现水墨画自动分类识别。  相似文献   

6.
陈圣  熊钦 《电子设计工程》2012,20(18):142-144,147
为了实现对模式识别、信号处理等领域中数据的有效表达,提出了一种基于规范互信息和动态冗余信号识别技术的特征选择方法。该方法采用规范互信息对特征相关性和冗余性进行测量,并通过一种动态冗余信号识别技术在特征全集中进行冗余特征的筛选。分类实验结果表明所提特征选择方法性能优于典型的特征选择方法。  相似文献   

7.
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除不相关特征及冗余特征;最后,利用基于相关性度量的特征评估函数以及序列搜索算法进一步降低特征维数,确定最优特征子集。实验表明,在保证算法整体分类精确率的前提下,算法能够有效提高小类别的分类性能。  相似文献   

8.
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除不相关特征及冗余特征;最后,利用基于相关性度量的特征评估函数以及序列搜索算法进一步降低特征维数,确定最优特征子集。实验表明,在保证算法整体分类精确率的前提下,算法能够有效提高小类别的分类性能。  相似文献   

9.
在图像分类中,单一特征提取容易造成图像信息的缺失,而多特征融合则会生成大量的冗余特征,使得图像分类的准确率降低。针对上述问题,通过改进邻域粗糙集特征选择算法,使其可以处理多维的图像特征,并将该算法应用于图像分类中。利用HOG和SURF结合空间金字塔匹配模型,得到最终的图像描述;利用线性SVM类性能和鲁棒性。  相似文献   

10.
步态就是个体的行走方式,它作为一种适用于非接触式远距离身份识别的生物特征近来倍受关注。文章提出了一种简单有效的利用行人的步态特征识别身份的算法。对于每个序列而言,行人的重心偏移量首先被用来去除序列中的冗余图像帧;然后,从图像中提取二值化人体轮廓的宽度信息,通过对其进行特征空间变换和规范空间变换来获得可分类的低维步态特征;标准的模式分类技术用于最终的识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号