首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
介绍了病毒主动式防御技术、已知病毒的变形检测技术以及改进的K-近邻算法的病毒主动式防御技术,并分析了它们的不足。提出了一种基于核的K-近邻算法与主动式防御技术相结合的解决方案,此方案既可高效地判断安全进程,又可较为准确地检测出未知病毒。  相似文献   

2.
在软件开发过程中,克隆代码已经成为引起软件缺陷的一个重要因素.针对现有的方法不能很好地处理内聚度低、功能交叉的克隆代码的问题,提出了一种基于K-最近邻的克隆代码重构方法.首先,对克隆代码进行静态分析,搜集控制依赖信息和数据流信息,再经过K-最近邻聚类方法,形成便于提取、功能独立的代码片段,然后对代码片段进行过程提取,使之成为一个独立的过程,并用过程调用替代原来的克隆代码.实验结果表明,该方法能够对克隆代码进行有效组织,并对功能独立的部分进行提取.  相似文献   

3.
针对目前基于行为分析的未知病毒检测方法需要运行可执行程序,无法检测出以静态形式存在计算机中的滴管等病毒的问题,提出了一种基于Win32 API相关行为检测PE未知病毒的方法。首先解析PE文件提取其调用的敏感Win32 API函数,然后将这些API函数按相关的恶意行为分类并形成维数固定的特征行为向量存入数据库。采用基于判别熵最小化的特征提取法自适应的精简特征项,最后利用改进的K-最近邻算法进行分类。实验结果表明,该方法具有较高的命中率和较低的漏判率,适用于“云安全”系统中未知病毒的检测。  相似文献   

4.
基于多重朴素贝叶斯算法的未知病毒检测   总被引:12,自引:0,他引:12  
提出了一种基于多重朴素贝叶斯分类算法的检测方法来实现对计算机病毒的近似判别。该法可以克服病毒特征代码扫描法不能识别未知病毒的缺点。在该检测方法的基础上,设计了一个病毒检测网络模型,该模型既可以实现对已知病毒的查杀,又可以对可疑程序行为进行分析评判,最终实现对未知病毒的识别。  相似文献   

5.
6.
在管道运输中传感器的正常使用至关重要,为了防止因传感器故障而导致的数据采集失效,造成误报警和漏报警,对传感器本身的故障诊断和失效分析已经成为当前研究的重要方向.通过对各传感器采集数据进行组合分析,以各传感器之间的数据关联特性作为研究内容,运用K-最近邻算法对管道上传感器所采集数据进行相似性拟合,提出采用C4.5算法定义各传感器所采集数据对目标传感器的支持度以决定目标传感器数据的有效性,对故障传感器运行状态进行分析与定位,进而判断传感器的数据可靠性和输差出现位置.实验结合西南某管道流量传感器数据进行分析,结果表明,该算法能够准确判断目标传感器数据的有效性和故障传感器在时域中发生的位置.  相似文献   

7.
在Skyline查询算法中,Lazy算法的数据处理能力较弱。针对该问题,利用最近邻过滤的思想,提出改进的NNSC算法。在预处理阶段,利用欧氏距离定义一个阈值,如果新插入数据对象的欧氏距离大于阈值,提前处理该对象,以提高算法利用率,减少资源的消耗。实验结果证明,NNSC可降低时空复杂度,对于正相关数据,性能提升效果明显。  相似文献   

8.
基于模糊模式识别的未知病毒检测   总被引:2,自引:1,他引:2  
提出了一种基于模糊模式识别的检测方法来实现对计算机病毒的近似判别。该方法可以克服病毒特征代码扫描法不能识别未知病毒的缺点。在该检测方法的基础上,文中设计了一个病毒检测网络模型,此模型既可以实现对已知病毒的查杀,又可以对可疑程序行为进行分析评判,最终实现对未知病毒的识别。  相似文献   

9.
非平衡混合数据是指数据集中类别不同的样本在数量上存在着较大的差别;同时样本数据集中的数据是非单一的数据类型,即它包含多种类型,如数值型和文本型数据。在对混合型数据的分类算法中,计数最近邻分类算法(CwkNN)可以有效地对混合型数据进行分类,但该算法对数据的非平衡性处理效果不是太理想。在CwkNN的基础之上结合数据的非平衡性特点提出了基于全局密度和K-密度的分类算法来提高少数类样本的权重,从而提高数据的分类精确度。实验结果表明,全局密度分类算法和CwkNN算法的分类精度相当,K-局部密度分类算法在一定程度上提高了分类的精度。  相似文献   

10.
数据缺失在各个研究领域中普遍存在,缺失的数据会对计算的性能与结果产生严重的影响。为提高填补缺失数据的准确度,提出一种基于聚类分析的缺失数据最近邻填补算法。该算法在对数据聚类分析后根据类别分配权重,在MGNN(MahalanobisGray and Nearest Neighbor)算法的基础上改进了计算方法和填充值的计算方式。实验结果表明,该方法填补的准确度比传统KNN和MGNN算法要高。  相似文献   

11.
基于KNN的不良文本过滤方法   总被引:1,自引:2,他引:1       下载免费PDF全文
不良文本过滤是当前的一个研究热点。通过对χ2统计量的具体分析,证明χ2统计量在2类文本特征项提取过程中特有的优势。提出正面文本阈值δ,并从理论上推断出该值的大小。在此基础上改进KNN算法,消除了KNN算法中N的不确定性,彻底实现了无参性,大幅减少了分类所用的时间。实验证明,该算法符合Web实时在线分类的要求。  相似文献   

12.
蔡维玲  陈东霞 《计算机工程》2010,36(22):175-177
讨论最小-最大规范化、z-score规范化及小数定标规范化3种方法对K近邻分类器性能的影响,在12个标准UCI真实数据集和1个人工数据集上进行实验比较。实验结果表明,规范化方法在大部分数据集能上提高K近邻分类器的识别率。针对实验结果研究据规范化方法提升分类器性能的内在原因,给出根据数据属性的数值分布特点决定是否使用数据规范化方法的一般准则。  相似文献   

13.
基于质心的文本分类算法   总被引:3,自引:1,他引:3       下载免费PDF全文
当文本集较分散或出现多峰值时,基于质心的文本分类算法分类效果很差。针对该问题提出一种改进的文本分类算法,与基于质心的经典分类算法相比,其性能较高。在香港慧科讯业公司提供的文本分类语料库上的测试结果表明,该算法的效率和精度满足要求。  相似文献   

14.
受免疫原理在入侵检测系统中成功应用的启发,提出了一种基于免疫的检测未知病毒的通用检测技术。由于病毒需要重定位模块来访问自己的资源,而这在正常程序中不常见,故可利用重定位模块来生成检测未知病毒的检测器。分析了计算机病毒的逻辑结构,建立了自体和非自体的演化方程、抗原提呈及抗体生成方法。实验表明,该技术不仅可检测已知病毒,还能有效检测未知病毒,且有自适应和自学习能力。  相似文献   

15.
陈小波  吴涛  高正龙 《计算机工程》2012,38(22):167-170
K近邻多标签学习算法的近邻点个数取固定值,而没有考虑样本分布的特点,可能会将相似度高的点排除在近邻集外,或者将相似度低的点包含在近邻集内,影响分类器的性能。为此,将粒计算的思想引入近邻集的构建,提出一种新的K近邻多标签学习算法。通过粒度控制,确定近邻点集,使得领域内的样本点有高相似性,且此类样本能进入近邻集。实验结果表明,该算法的大多数评价指标均优于现有的多标签学习算法。  相似文献   

16.
本文将模式识别分类技术应用于股票市场进行搜索选股。本项目采用股票价格走势来构造特征空间,依据样本股票价格走势类型对股票市场上的所有股票进行模式识别分类,并将所获得的分类结果中的第一类股票作为搜索选股的目标股票。通过对沪深两市股票进行的实证研究分析,结果表明:采用模式识别分类技术依据股票价格走势进行搜索选股是可行的,具有良好的实时性和较高的针对性,实用性较强,并可进一步改进。  相似文献   

17.
文本表示的高维性会增加文本分类时的计算复杂度。针对该问题,构建基于类邻域字典的线性回归分类模型。采用K近邻方法构造各类别的类邻域字典,根据对测试样本的不同表示,分别提出基于级联类邻域字典和基于类邻域字典的线性回归分类算法。此外,为缓解噪声数据对分类性能的影响,通过度量测试样本与各个类别之间的相关度裁剪噪声类数据。实验结果表明,该模型对长文本和短文本均能够得到较高的分类精度和计算效率,同时,噪声类裁剪策略使其对包含较多类别数的文本语料也具有较好的分类性能。  相似文献   

18.
针对流媒体的流行度预测问题,提出一种基于视频特征及历史数据的流行度预测模型。首先,根据视频特征及在社交网络中的影响力,使用K-近邻(KNN)算法对视频的流行程度进行预测。然后,基于流行程度的预测结果,结合自回归滑动平均(Autoregressive Moving Average,ARMA)模型对视频的点播量进行预测。最后,通过爬取豆瓣电影及新浪微博数据,对模型进行试验。结果表明,与朴素贝叶斯分类器及ARMA模型相比,本文模型的召回率(recall)明显较高,平均平方根误差(RMSE)降低了约20%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号