首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
研究网络安全风险动态评估方法,提高评估的准确性.当前网络安全风险评估没有考虑不同入侵特征造成的网络指标变化,以入侵前后相同静态固定指标变化评估为主,缺少不同时段内动态可持续评估的方法.为解决上述问题,提出基于特征映射关联算法的网络安全风险动态评估方法.对网络中的操作特征进行加权优化处理,提取网络操作异常特征,计算异常特征提取误差,针对异常特征提取误差进行补偿.根据网络异常特征获取特征分类函数,并计算特征分类的约束条件,建立特征属性映射模型,获取特征映射关联性,实现网络异常特征的分类,完成网络安全风险动态评估.实验结果表明,利用改进算法进行网络安全风险动态评估,能够极大的提高评估的准确性,满足网络安全的实际需求.  相似文献   

2.
随机森林为集合算法中最为经典的模型之一,利用多棵并行独立的决策树投票分类.随机森林使用有放回采样方法,随机采样若干个样本集合,针对这些样本集合构造若干个决策树.由于采样过程和决策树属性选择具有随机性,随机森林较好地解决了决策树的过拟合问题.不过随机森林算法中每颗决策树都是一样的权重,这显然不合理.包外误差作为衡量模型泛化误差的指标,利用包外误差赋予每颗决策树不一样的权重解决信用卡欺诈问题.经实验证明,提出的算法精确度提高,是更为有效的算法.  相似文献   

3.
以提升医疗网络安全风险评估精度为目标,提出基于数据挖掘算法的医疗网络安全风险评估方法。首先采用病态指数循环分析法确定医疗网络安全风险评估指标,构建医疗网络安全风险评估指标体系,并采用层次分析法设置每个评估指标的权重值,然后采用马尔科夫链和模糊综合法设计医疗网络安全风险评估模型,最后进行医疗网络安全风险评估仿真测试实验。实验结果表明,风险评估结果符合实际情况,风险评估精度极高,评估结果有效可信。  相似文献   

4.
现有的电力监控网络安全风险评估方法,在度量风险值时指标权重分配不均,导致所得风险评估效率较差,为提高风险评估的实时性,基于改进AHP算法设计电力监控网络安全风险评估方法。建立电力监控网络安全层次结构模型,将其分为目标层、准则层以及方案层,计算电力监控网络安全风险因素指标权重,重新分配安全风险因素权重系数,基于改进AHP算法度量电力监控网络整体风险值,建立层次分明的电力监控网络安全评估构架,设计风险评估算法,实现电力监控网络安全风险的评估。分别使用三种不同的攻击模式对模型中的四个主机进行攻击,通过风险值的测试结果可知,该电力监控网络安全风险评估方法可以迅速有效地检测各节点在恶意攻击下的风险值。  相似文献   

5.
运用群决策方法,对随机森林、神经网络、梯度提升树三种算法所生成的个体学习器进行集成,构建基于群决策的P2P借贷信用风险评估模型.选取人人贷、拍拍贷的数据进行实验研究,结果显示,集成模型的风险评估效果较个体学习器有所提升,且优于传统的逻辑回归方法.  相似文献   

6.
数据不平衡会严重影响传统分类算法的性能,不平衡数据分类是机器学习领域的一个热点和难点问题。为提高不平衡数据集中少数类样本的检出率,提出一种改进的随机森林算法。该算法的核心是对每一棵通过Bootstrap采样后的随机森林子树数据集进行混合采样。首先采用基于高斯混合模型的逆权重上采样,然后基于SMOTE-borderline1算法进行级联上采样,再用随机下采样方式进行下采样,得到每棵子树的平衡训练子集,最后以决策树为基学习器实现改进机随机森林不平衡数据分类算法。此外,以G-mean和AUC为评价指标,在15个公开数据集上将所提算法与10种不同算法进行比较,结果显示其两项指标的平均排名和平均值均为第一。进一步,在其中9个数据集上将其与6种state-of-the-art算法进行比较,在32次结果对比中,所提算法有28次取得的成绩都优于其他算法。实验结果表明,所提算法有助于提高少数类的检出率,具有更好的分类性能。  相似文献   

7.
异常数据检测一直是无线传感器网络安全的重要防护手段.针对现有方案计算复杂度高和检测精度低等问题,提出一种离散二进制粒子群优化孤立森林算法(BPSO-iForest).依据选择性集成思想,利用离散二进制粒子群算法改进由孤立森林算法生成的初始森林,选取初始森林中精度高、差异性大的隔离树,构建最优孤立森林,提升异常数据的检测精度和算法的执行效率.在无线传感器网络数据集上,与传统孤立森林、随机森林算法及其改进算法进行对比实验,结果表明本算法的检测精度和执行效率有明显的提升.  相似文献   

8.
学习样本的质量和数量对于智能数据分类系统至关重要,但在数据分类系统中没有一个通用的良好方法用于发现有意义的样本。以此为动机,提出数据集合凸边界的概念,给出了快速发现有意义样本集合的方法。首先,利用箱型函数对学习样本集合中的异常和特征不全样本进行清洗;接着,提出数据锥的概念,对归一化的学习样本进行锥形分割;最后,对每个锥形样本子集进行中心化,以凸边界为基础提取距离凸边界差异极小的样本构成凸边界样本集合。实验在12个UCI数据集上进行,并与高斯朴素贝叶斯(GNB)、决策树(CART)、线性判别分析(LDA)、提升算法(AdaBoost)、随机森林(RF)和逻辑回归(LR)这六种经典的数据分类算法进行对比。结果表明,各个算法在凸边界样本集合的训练时间显著缩短,同时保持了分类性能。特别地,对包含噪声数据较多的数据集,如剖腹产、电网稳定性、汽车评估等数据集,凸边界样本集合能使分类性能得到提升。为了更好地评价凸边界样本集合的效率,以样本变化率和分类性能变化率的比值定义了样本清洗效率,并用该指标来客观评价凸边界样本的意义。清洗效率大于1时说明方法有效,且数值越高效果越好。在脉冲星数据集合上,所提方法对GNB算法的清洗效率超过68,说明所提方法性能优越。  相似文献   

9.
作为人类基因组重要的表观遗传现象,DNA甲基化对基因的表达发挥着重要的调控作用,与癌症的关系密切。针对癌症基因组图谱(TCGA)庞大数据的类不平衡和高维度,致使假阴率大幅增加的问题,提出了一种混合采样的不平衡数据集成分类算法,使用合成少数过采样(SMOTE)算法生成新的少数类样本,得到扩充后的数据集,通过Tomek Link算法剔除样本扩充过程中引入的噪声,得到相对平衡的数据集。在此基础上,利用深度森林(gcForest)算法的级联森林结构,每一层选取两种随机森林结构,以增强模型的泛化能力,得到最终的分类模型。对6种癌症的DNA甲基化数据实验表明混合采样的不平衡数据集成分类算法在保证多数类分类精度的前提下,有效地提高了对于少数类的灵敏度。  相似文献   

10.
随机森林(RF)具有抗噪能力强,预测准确率高,能够处理高维数据等优点,因此在机器学习领域得到了广泛的应用。模型决策树(MDT)是一种加速的决策树算法,虽然能够提高决策树算法的训练效率,但是随着非纯伪叶结点规模的增大,模型决策树的精度也在下降。针对上述问题,提出了一种模型决策森林算法(MDF)以提高模型决策树的分类精度。MDF算法将MDT作为基分类器,利用随机森林的思想,生成多棵模型决策树。算法首先通过旋转矩阵得到不同的样本子集,然后在这些样本子集上训练出多棵不同的模型决策树,再将这些树通过投票的方式进行集成,最后根据得到的模型决策森林给出分类结果。在标准数据集上的实验结果表明,提出的模型决策森林在分类精度上明显优于模型决策树算法,并且MDF在树的数量较少时也能取到不错的精度,避免了因树的数量增加时间复杂度增高的问题。  相似文献   

11.
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。  相似文献   

12.
研究建筑施工项目安全风险准确评估问题,由于系统存在非线性因素,构建模型较困难.传统评估方法需要样本数目大,而建筑施工项目安全风险是一种典型的小样本数据,导致传统方法的评估精度低.为提高建筑施工项目安全风险评估精度,利用支持向量机专门针对小样本数据建模的优点,提出一种粒子群算法优化支持向量机的建筑施工项目安全预警系统(PSO-SVM).首先采用建筑施工项目安全风险评估正确率作为建模目标,评价指标确定评估模型结构,然后采用粒子群算法优化支持向量机建立评估模型,以克服传统评估方法存的缺陷,以解决建筑施工项目安全风险评估精度的难题.仿真结果表明,相对于神经网络,PSO-SVM提高了风险评估精度,在建筑施工项目管理具有一定的实际应用价值.  相似文献   

13.
针对传统的数据可信度评估模型存在分类适应性较差的问题,设计一种基于指数分层结构算法的数据可信度评估模型。分析实际数据资产管理过程,建立数据可信度评估指标体系;按照数据类型和数据间存在的周期性关系补充待评估数据中的缺漏数据,完成对待估数据的预处理;将数据归一化后生成数据集合,并根据数据间的相关系数建立亚超度量空间,生成指数分层结构树,结合层次分析法完成对可信度模型的设计。实验结果表明,与传统评估模型相比,所提模型的分类适应性更强,数据查全率更高,应用优势更明显。  相似文献   

14.
由于高维数据通常存在冗余和噪声,在其上直接构造覆盖模型不能充分反映数据的分布信息,导致分类器性能下降.为此提出一种基于精简随机子空间多树集成分类方法.该方法首先生成多个随机子空间,并在每个子空间上构造独立的最小生成树覆盖模型.其次对每个子空间上构造的分类模型进行精简处理,通过一个评估准则(AUC值),对生成的一类分类器进行精简.最后均值合并融合这些分类器为一个集成分类器.实验结果表明,与其它直接覆盖分类模型和bagging算法相比,多树集成覆盖分类器具有更高的分类正确率.  相似文献   

15.
师彦文  王宏杰 《计算机科学》2017,44(Z11):98-101
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器。首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于不同样本的代价差异;其次,执行随机森林算法,对数据集作K次抽样,构建K个基础分类器;然后,基于提出的不纯度度量,通过分类回归树(CART)算法来构建决策树,从而形成决策树森林;最后,随机森林通过投票机制做出数据分类决策。在UCI数据库上进行实验,与传统随机森林和现有的代价敏感随机森林分类器相比,该分类器在分类精度、AUC面积和Kappa系数这3种性能度量上都具有良好的表现。  相似文献   

16.
随机森林分类算法在产生决策树以及投票流程中各个决策树的分类准确度各不相同,由此带来的问题是少部分决策树会影响随机森林算法的整体分类性能。除此以外,数据集中的不平衡数据也能影响到决策树的分类精度。针对以上缺点,对Bootstrap抽样方法添加约束条件,以降低非平衡数据对生成决策树的影响;以及利用袋外数据(Outof-Bagging)和非平衡系数对生成的决策树进行评估加权。试验结果表明,所提算法改善了随机森林对不平衡数据的分类精度。  相似文献   

17.
针对恶意软件家族分类问题,提出一种基于行为路径树的恶意软件分类方法,该方法使用恶意样本细粒度行为路径作为动态特征,通过将路径转化为树型结构的方式生成依赖关系,与传统基于系统调用的恶意软件分类相比,具有较低的复杂度。此外,针对传统分类模型无法解决行为路径树深度寻优问题,设计了基于自适应随机森林的分类模型,该模型采用随机逼近的方式完成行为路径树深度寻优。实验部分使用2588个样本(包含8个恶意家族,1个良性集合)对行为路径树的有效性进行验证,分类精度达到91.11%。  相似文献   

18.
随着互联网和借贷业务的迅速发展,超前消费日趋常态化。银行信贷在满足居民消费需求、促进国民经济发展的同时,也伴随着失信行为带来的影响,给银行造成了巨大损失。借助机器学习技术建立有效的风险控制模型,做好风险防控,已成为业界的迫切需求。本文基于银行风险防控的需求,针对模型构建的需要,对相关数据集进行了统计分析和预处理,为提供模型构建所需的高质量数据样本做了前期准备。基于随机森林算法,利用集成思想的优势,建立了一种有效的风险控制模型。通过性能度量指标对模型进行评估和参数优化,并与决策树算法模型进行对比,根据最终的实验结果验证基于随机森林算法的银行风险控制模型的可行性和有效性。  相似文献   

19.
网络安全风险评估是解决网络安全行之有效的措施之一,本文以支持向量机为基础,将网络安全风险评估归纳为一个支持向量回归问题,结合组合核函数的优点,建立了基于SVM的二分类网络安全风险评估模型,并给出了模型实现方法;以资产、威胁和脆弱性为风险评估指标,以及低、较低、中、较高、高五个风险程度等级建立了综合评估体系。结合某企业6月份网络安全记录样本,以组合核函数为评估模型的核函数,通过交叉验证和最速下降法,得到了最优预测模型。实践证明,该模型对网络安全风险评估是可行的。  相似文献   

20.
阮志峰 《自动化应用》2023,(7):159-161+165
互感器状态因受多种因素影响,导致评估指标权重重要程度的计算难度较大,因此,本文提出基于随机森林算法的电力电子互感器状态评估模型。通过提取电力电子互感器状态评估指标,利用随机森林算法精准计算评估指标的权重重要程度。综合指标的权重值,构建电力电子互感器状态评估模型。实验结果表明,利用随机森林算法设计的评估模型评估互感器的4种运行状态,其评估正确率均高于传统评估模型,达到了99%以上。由此可见,利用基于随机森林算法的互感器状态评估模型在评估互感器运行状态领域中具有很高的评估正确率,完全可以满足实际应用需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号