首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
基因芯片数据具有维数高、样本少、高冗余的特点,以基因芯片数据进行特征选择及分类处理为研究对象。粗糙集理论能很好地消除冗余数据,但它不适应连续型的基因芯片数据,通过基于邻域粗糙集模型的方法能很好地解决这一问题,但如何选择好邻域半径来提高分类效率一直没有固定的方法。从各条件属性标准差来得到一组邻域半径,进而得到各样本邻域。经典的芯片数据实验表明:基于优化的邻域半径组比传统设定单一的邻域半径能取得较好的分类效果,和传统的特征选择算法做比较也能得到较少的特征基因和较高的分类能力。  相似文献   

2.
入侵检测灰色空间模型及应用   总被引:1,自引:0,他引:1  
建立了基于粗糙集理论的入侵检测灰色空间模型,根据信息增益设计等价类获取和约简算法,提出了一种新的入侵检测系统模型。运用KDDCUP99数据集对网络入侵检测进行了测试。分析和对比实验结果表明,该模型具有分类规则简单、检测时间短和准确率高等特点,克服了检测系统不能有效判别未知行为的瓶颈。  相似文献   

3.
为了有效应对脑功能连接高维小样本性给分类模型构建带来的挑战,得到与脑疾病诊断相关的重要特征,提出基于鱼群算法的脑功能连接邻域粗糙集特征归约方法.该方法建立脑功能连接数据的邻域决策表;依据特征的依赖度将鱼个体初始化为候选的脑功能连接特征子集,并采用综合特征子集依赖度和特征子集长度的适应度函数对鱼个体进行评价;在种群优化过程中,执行觅食、聚集、追尾机制,以及交叉和迁徙2个新机制来不断搜索最优的特征子集.在3种脑疾病功能磁共振脑成像(fMRI)数据集上,将所提方法与多种已有的特征归约方法进行对比实验.结果表明,该方法是有效的脑功能连接特征归约方法,可以有效降低脑功能连接数据的维度,获得分类判别能力较强的脑功能连接特征.  相似文献   

4.
入侵检测实质上可以被描述为对数据样本进行尽可能正确的分类,关键问题是特征选择和模式识别方法的选择.采用SVM分类器组合的方法对数据样本进行分类,结合协议分析技术,提出了基于协议分析和SVM多分类的入侵检测系统模型,并利用KDD CUP 99数据集对系统模型进行测试.测试结果表明,所提出的方法有效提高了入侵检测的效率,降低了漏报率和误报率.  相似文献   

5.
针对高维、小样本及不确定性的基因表达数据,融合模糊可容忍性的邻域粒化技术与具有全局寻优能力的鱼群智能算法,提出基于邻域粗糙集与鱼群智能的基因选择方法。首先,采用邻域粗糙集对基因数据进行邻域粒化,形成邻域粒子;其次,提出基于邻域分类精度的不确定性评价函数,用以评价邻域粒子的不确定性,分辨关键性基因;进一步融合鱼群智能方法,设计一种基因选择算法,选取分类性强的少量关键基因;最后,在两个癌症基因数据集中进行基因选择,采用SVM分类器对获取的关键基因组进行分类实验。实验结果表明,采用该方法获取的基因组具有较低的冗余度及较好的分类性能。  相似文献   

6.
针对入侵检测数据中的冗余特征和冗余实例,提出一种基于主成分分析和混合稳态遗传算法的双向数据压缩方法.利用主成分分析对特征进行压缩,有效地去除特征之间的冗余性;用混合稳态遗传算法进行实例压缩,大大缩减了实例的数量;提出一个基于神经网络的入侵检测系统模型,该模型具有多分类、易于更新系统及快速适应新型入侵的特点.在KDD CUP’99上的实验表明,提出的方法是有效的,可以用于处理大数据集的压缩问题.  相似文献   

7.
肿瘤基因选择方法LLE Score   总被引:1,自引:0,他引:1  
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性.  相似文献   

8.
针对入侵检测系统产生的高维数据的处理问题,提出基于GA与BP神经网络的入侵检测组合模型进行特征选择。为了优化入侵检测分类算法,利用遗传算法适合复杂系统优化的特点,去除入侵检测数据多维特征属性中的冗余部分,将入侵检测数据特征属性对应到染色体,BP神经网络的分类准确率作为种群个体的适应度值,通过遗传算法的全局搜索能力,找出对分类算法最有影响的特征属性组合,从而达到降维的目的。采用KDD99数据集进行分析,实验表明,经过组合算法特征选择的数据能在分类正确率、运算时间、运算稳定性等方面取得更优的效果。  相似文献   

9.
在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的不确定性.针对上述问题,文中提出基于邻域粗糙集的长尾分布数据在线流特征选择算法.借助邻域粗糙集模型,并考虑邻域内样本间的关系后,定义了自适应邻域关系,设计基于稀有类样本重要性的依赖度计算公式.同时,利用层次结构降低类别不平衡性,提出在线冗余度分析和在线重要度分析两种在线特征评价指标,用于选出具有高可分离性和强区分性的特征子集.实验结果表明所提算法优于其它先进算法.  相似文献   

10.
潘思远    刘园奎    毛煜    林耀进   《南京师范大学学报》2023,(1):066-74
多标记学习可以同时处理与一组标记相关的数据,多标记学习的研究对于多义性对象的学习建模具有十分重要的意义. 与传统的单标记学习一样,数据的高维性是多标记学习的阻碍,因此数据降维是一项十分重要的工作,而特征选择是一种有效的数据降维技术. 提出了基于邻域近似误差率的多标记特征选择算法. 首先,在邻域粗糙集理论的基础上,引入实例的边界来对所有实例进行粒度化. 其次,基于邻域决策误差率提出了邻域近似误差率的策略来评价特征. 最后,在公开的数据集上进行了大量的实验,结果表明所提算法的有效性.  相似文献   

11.
In this paper,we propose two intrusion detection methods which combine rough set theory and Fuzzy C-Means for network intrusion detection.The first step consists of feature selection which is based on rough set theory.The next phase is clustering by using Fuzzy C-Means.Rough set theory is an efficient tool for further reducing redundancy.Fuzzy C-Means allows the objects to belong to several clusters simultaneously,with different degrees of membership.To evaluate the performance of the introduced approaches,we apply them to the international Knowledge Discovery and Data mining intrusion detection dataset.In the experimentations,we compare the performance of two rough set theory based hybrid methods for network intrusion detection.Experimental results illustrate that our algorithms are accurate models for handling complex attack patterns in large network.And these two methods can increase the efficiency and reduce the dataset by looking for overlapping categories.  相似文献   

12.
粗糙集理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具,文中以实例介绍了粗糙集的基本理论,并通过一个实例详细介绍了在基于对决策表属性约简的基础上采用了可变精度粗糙模型实现规则的获取. 该实例说明了基于粗糙集进行规则的挖掘是有效的.  相似文献   

13.
用知识的条件粗糙熵定义了特征的相对重要性,提出了一种基于条件粗糙熵的入侵数据特征并行选择算法。算法首先将入侵数据决策表划分成多个子表,然后利用特征的相对重要性对各子表并行求解,最后以子表选出的局部特征为基础求得原决策表的约简。实验表明,该算法适用于大规模的入侵数据集,选出的特征属性不仅可以大大减少数据在存储、分析以及各组件共享中的代价,还能够保持并提高入侵分类的准确性。  相似文献   

14.
在网络入侵检测中,由于原始数据特征维度高和冗余特征多,导致入侵检测系统的存储负担增加,检测分类器性能降低。针对该问题本文提出了一种基于信息论模型的入侵检测特征提取方法。它以具有最大信息增益的特征为搜索起点,利用搜索策略和评估函数迭代调整数据集分类标记、已选取特征子集和候选特征三者之间的相关度,最后通过终止条件确定选取特征子集。以入侵检测样本数据集为实验数据,将该方法选取的特征向量运用到支持向量机分类算法中,在特征维度大幅度降低的情况下,检测精度变化很小。实验结果证明了本方法的有效性。  相似文献   

15.
Aiming at the problems of the low detection rate of traditional intrusion detection systems and the long training and detection time of intrusion detection systems based on deep learning,an adaptive binning feature selection algorithm using the information gain is proposed,which is combined with LightGBM to design a fast network intrusion detection system.First,the original data set is preprocessed to standardize the data;then the redundant features and noise in the original data are removed through the adaptive binning feature selection algorithm,and the original high-dimensional data are reduced to the low-dimensional data,thereby improving the accuracy of the system and reducing the training and detection time;finally,LightGBM is used for model training on the training set selected by the characteristics to train an intrusion detection system that can detect attack traffic.Through verification on the NSL-KDD data set,the proposed feature selection algorithm only takes 27.35 seconds in feature selection,which is 96.68% lower than that by the traditional algorithm.The designed intrusion detection system has an accuracy rate of 93.32% on the test set,and its training time is low.Compared with the existing network intrusion detection system,the accuracy rate of the proposed system is higher,and its model training speed is faster.  相似文献   

16.
粗糙集理论在变压器故障诊断中的应用   总被引:7,自引:0,他引:7  
为了对变压器故障诊断过程中大量的冗余特征进行压缩或约简,提高诊断的效率,将粗糙集理论引入到变压器故障诊断中,提出了基于粗糙集理论的故障特征约简算法:即由故障样本构成信息表,组合表中不同的属性集,求取与全体属性集具有相同分类质量的最小属性集。对具体典型诊断实例进行了分析,结果表明:在保证故障分类结果不变的情况下,该算法能够剔除具有冗余信息的特征,找出对故障分类起主要作用的特征,从而达到了特征约简的目的,不仅大大减少了诊断信息提取的工作量,也为后续的智能诊断提供很大的便利。  相似文献   

17.
网络入侵检测通过分析流量特征来区分正常和异常的网络行为以实现入侵流量的检测,是网络安全领域的重要研究课题.针对已有入侵检测模型特征提取过程复杂、信息提取不足等问题,提出了一种基于内外卷积网络的入侵检测模型.首先使用一维卷积神经网络提取流量数据的内部特征,然后通过对内部特征计算相似度建模得到无向同质图,此外将流量在外部网络侧的通信行为建模为有向异质图,并对两图使用图卷积网络学习包含网络流量多种交互行为的嵌入向量,最后将学习到的流量嵌入向量输入到分类器中用于最终的分类.实验结果表明,所提模型的检测准确率和误报率均优于对比模型.  相似文献   

18.
遗传算法在入侵检测中的应用   总被引:3,自引:0,他引:3  
介绍了基于模型推理和基于模型两种入侵检测系统,提出了一种新的基于智能体技术的入侵检测系统体系结构,解决了传统集中式入侵检测系统的弊病,将任务处理和数据分布到网络各个结点上,充分利用网络资源协同完成入侵检测任务;介绍了遗传算法在该系统中的应用,因系统安全的先验知识体现在对原始数据中有价值特征属性变量集的选择上,故利用遗传算法对特征属性变量子集的选择进行优化,找到相对最优的由特征向量表示的特征属性变量集,以降低入侵检测系统的负荷。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号