首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 812 毫秒
1.
王赞  闫明  刘爽  陈俊洁  张栋迪  吴卓  陈翔 《软件学报》2020,31(5):1255-1275
随着深度神经网络技术的快速发展、大数据的涌现和计算能力的显著提升,深度神经网络被越来越多地应用到各个安全攸关领域,例如自动驾驶、人脸识别、飞机碰撞检测等.传统的软件系统通常由开发人员手工编写代码实现其内部的决策逻辑,并依据相应的测试覆盖准则设计测试用例来测试系统代码.与传统的软件系统不同,深度学习定义了一种新的数据驱动的编程范式,开发人员仅编写代码来规定深度学习系统的网络结构,其内部逻辑则由训练过程获得的神经元连接权值所决定.因此,针对传统软件的测试方法及度量指标无法直接被移植到深度神经网络之上的问题,近年来,越来越多的研究致力于解决深度神经网络的测试问题,例如提出新的测试评估标准、测试用例生成方法等.调研了92篇相关领域的学术论文,从深度神经网络测试度量指标、测试输入生成、测试预言这3个角度对目前已有的研究成果进行了系统梳理.同时,分析了深度神经网络测试在图像处理、语音处理以及自然语言处理上的已有成果,并介绍了深度神经网络测试中应用到的数据集及工具.最后,对深度神经网络测试的未来工作进行了展望,以期为该领域的研究人员提供参考.  相似文献   

2.
随着深度学习技术的快速发展,对其质量保障的研究也逐步增多.传感器等技术的迅速发展,使得收集测试数据变得不再困难,但对收集到的数据进行标记却需要花费高昂的代价.已有工作尝试从原始测试集中筛选出一个测试子集以降低标记成本,这些测试子集保证了与原始测试集具有相近的整体准确率(即待测深度学习模型在测试集全体测试输入上的准确率),但却不能保证在其他测试性质上与原始测试集相近.例如,不能充分覆盖原始测试集中各个类别的测试输入.提出了一种基于多目标优化的深度学习测试输入选择方法 DMOS(deep multi-objectiveselection),其首先基于HDBSCAN(hierarchicaldensity-basedspatialclusteringofapplicationswith noise)聚类方法初步分析原始测试集的数据分布,然后基于聚类结果的特征设计多个优化目标,接着利用多目标优化求解出合适的选择方案.在8组经典的深度学习测试集和模型上进行了大量实验,结果表明, DMOS方法选出的最佳测试子集(性能最好的Pareto最优解对应的测试子集)不仅能够覆盖原始测试集中更多的测试输入类别...  相似文献   

3.
随着深度学习技术在现实世界的广泛应用,人们对基于深度神经网络的系统安全性提出了更高要求.鲁棒性是神经网络的重要安全性质,对网络鲁棒性的量化分析和验证是深度学习模型安全性研究的关键问题.针对神经网络验证技术中难以解决的效率问题,提出了一种新颖的优先次序优化方法.结合局部鲁棒性的规约方式,在一组待验证输入内选择具有更高验证需求的不稳定点代替常规的逐点验证模式.根据对鲁棒性问题与决策边界距离的关联性分析,提出了一种基于网络输出单元值大小的鲁棒性评估方法作为优先验证的输入点选择依据.在此基础上将其扩展为输入的预分析模块与验证工具集成,进而设计了基于优先次序的验证框架.在常用的验证基准上进行了实验,结果表明,该方法的决策边界分析理论与突变测试结果一致,鲁棒性评估中选择不安全样本的平均准确率高于90%,通过减少安全样本的验证开销使验证效率提高了148.6%~432.6%.  相似文献   

4.
航天测控软件是航天测控系统的重要组成部分,作为任务的关键性实时软件,其可靠性直接影响着整个测控系统的可靠性。长期以来,测控系统软件相对缺乏系统的可靠性测试研究。文中针对航天工程地面测控软件的特点及可靠性测试要求,综合考虑缺陷等级、输入域等因素,按照数学算法建立了基于输入域分类的实时软件的可靠性混合模型,并对该模型的实际应用进行了介绍。文中模型和测试算法对航天测控工程领域典型功能软件进行了可靠性测试,实验结果表明了该方法的可行性、有效性和易用性。  相似文献   

5.
神经网络技术在图像处理、文本分析和语音识别等领域取得了令人瞩目的成就,随着神经网络技术应用到一些安全攸关的领域,如何保证这些软件应用的质量就显得尤为重要。基于神经网络技术的软件在开发和编程上和传统软件有着本质的区别,传统测试技术很难直接应用到此类软件中,研究针对神经网络的验证和测试评估技术十分必要。从有效评估和测试神经网络出发,对神经网络验证和测试技术的研究现状进行梳理,分别从验证技术、基于覆盖的测试技术、基于对抗样本的测试技术、融合传统测试技术等方面进行了归纳和分类。对其中一些关键技术的基本思想和实现做了简明扼要的介绍,并列举了一些测试框架和工具,总结了神经网络验证和测试工作面临的挑战,为该领域的研究人员提供参考。  相似文献   

6.
航天测控软件是航天测控系统的重要组成部分,作为任务的关键性实时软件,其可靠性直接影响着整个测控系统的可靠性.长期以来,测控系统软件相对缺乏系统的可靠性测试研究.文中针对航天工程地面测控软件的特点及可靠性测试要求,综合考虑缺陷等级、输入域等因素,按照数学算法建立了基于输入域分类的实时软件的可靠性混合模型,并对该模型的实际应用进行了介绍.文中模型和测试算法对航天测控工程领域典型功能软件进行了可靠性测试,实验结果表明了该方法的可行性、有效性和易用性.  相似文献   

7.
针对目前e-learning环境下测试评估系统在资源共享和范围划分灵活等方面的问题,提出了一个基于对象本体的测试评估系统模型,该模型需要建立基于本体的测试对象库,然后对用户输入的测试要求进行分词、本体提取和测试对象定位,并根据用户的个人信息提供个性化的测试,基于该模型建立的测试评估系统在资源共享、资源重用以及测试评估范围的灵活划分与试题的灵活选择方面具有较好的效果。  相似文献   

8.
代贺鹏  孙昌爱  金慧  肖明俊 《软件学报》2023,34(11):5008-5028
深度学习系统具有强大的学习与推理能力, 在无人驾驶、语音识别和机器人等领域应用广泛. 由于数据集的限制以及依赖人工标签数据, 深度学习系统易于出现非预期的行为. 近年来, 深度学习系统的质量问题受到广泛的关注, 特别是在安全攸关的领域. 由于模糊测试具有较强的故障揭示能力, 运用模糊测试技术对深度学习系统进行测试成为研究热点. 从测试用例生成(包括种子队列构建、种子选择和种子变异)、测试结果判定、覆盖分析3个方面对已有的深度学习系统的模糊测试技术进行总结, 并介绍常用的数据集以及度量指标, 最后对其发展方向进行展望.  相似文献   

9.
基于扩展有限状态机测试中测试输入数据自动选取的研究   总被引:11,自引:0,他引:11  
张涌  钱乐秋  王渊峰 《计算机学报》2003,26(10):1295-1303
扩展有限状态机(EFSM)模型是有限状态机(FSM)模型的一个扩展,它在FSM模型的基础上增加了变量、操作以及状态迁移的前置条件,通过EFSM我们可以更加精确地刻画软件系统的动态行为.基于EFSM的测试可以应用到许多领域,因此具有重要的研究价值和实际意义.许多研究人员已经提出了基于FSM测试的测试输入序列的构造方法,但基于EFSM的测试与FSM相比由于变量和状态迁移的前置条件的引入,增加了构造其测试输入的复杂性.我们认为基于EFSM测试的测试输入应该包含两个部分:即测试输入序列以及该输入序列上包含的输入变量的确定值(测试输入数据).手工选取这些测试数据的工作十分繁琐,极大地增加了测试的花费,因此自动选取这些测试数据可以大大提高实际测试工作的效率.该文提出一种基于EFSM测试的测试数据自动选取方法,该方法利用两个关键的步骤:①区间削减和②分段梯度最优下降算法来自动选取测试数据.实验表明利用该方法可以自动选取大部分的测试数据,并且收敛速度较快;在某些无法得到确定解的情况下,区间削减也可以为测试人员提供一个较小的输入变量取值区间,方便了测试人员从中手工选择测试数据.  相似文献   

10.
测试序列的生成是协议一致性测试中重要的研究领域,怎样使生成的测试序列既具有较强的检错能力又具有较广的差错覆盖范围成为许多科研人员研究的重点。文章在介绍了有限状态机族型和唯一输入/输出序列后,对基于UIO的测试序列生成方法进行了分析,然后对该方法进行了优化研究。使用优化后的算法可以缩短测试序列的长度,提高了测试效率和差错...  相似文献   

11.
基于确定有限状态机的测试输入序列选取   总被引:5,自引:0,他引:5  
有限状态机可以精确地刻画软件系统或其子系统的行为,其在软件建模中被广泛应用,基于有限状态机的测试问题得到了广泛的研究,其中WP方法由于限制条件较少,并且其可以达到较高的错误覆盖度,因此被广泛使用,但当有限状态机的实现中的状态数目的估计值m较大时,产生的测试输入序列相对较少的测试输入序列数目,可以提高测试效率,同时本文对Wp方法和R-Wp方法产生的测试输入序列数目进行了讨论,并证明了该方法与Wp方法相同的错误覆盖能力。  相似文献   

12.
王文祥  高庆  许可  张世琨 《软件学报》2023,34(4):1594-1612
软件崩溃是一种严重的软件缺陷,可导致软件终止运行.因此,对软件崩溃的测试在软件迭代的过程中极为重要.近年来,模糊测试技术(如AFL)由于可以自动化生成大量的测试输入来触发软件崩溃,被广泛用于软件测试中.然而,通过该技术产生的导致软件崩溃的测试输入中,大部分崩溃的触发原因都是重复的,因此软件开发人员需要对测试输入进行分类,带来了许多冗余工作.目前,测试输入分类已经有很多自动化方法,主要包括基于程序修复的分类算法和基于软件崩溃信息的分类算法.前者通过对程序在语义上进行分析,在运行时通过在程序中替换修复模板后重新运行测试输入,进而对输入分类.因为此方法需要人为地对于软件崩溃编写修复模板,所以其分类的效率与修复模板的质量存在很大联系;且由于需要先修复崩溃、再对崩溃做分类,影响了软件崩溃的修复效率.采用后者的思想,提出了一种轻量而高效的利用软件崩溃信息的测试输入分类算法CICELY.其在软件崩溃点堆栈信息分类的算法基础上,在分析软件崩溃点堆栈时引入了动态链接库信息,通过区分系统动态链接库与用户动态链接库,结合用户代码位置信息,得到用户关注的函数集合,以在分类时以用户函数为基准对崩溃进行界定.最后...  相似文献   

13.
设计一种数字视频领域用于设备测试评估的测试设备低成本解决方案。该方案采用USB2.0接口,带有存储深度为16MB可扩展缓存,针对数字视频领域的不同应用,配置相应的FPGAIP核,配合I/O接口模块和PC应用软件对被测试模块、系统进行有效评估。  相似文献   

14.
针对传统导弹并行测试系统安全性评价主观因素突出的缺点,提出基于神经网络的导弹并行测试系统安全性模糊综合评估模型.首先建立了导弹并行测试系统安全性评价的指标体系,其次介绍了基于IA- BP神经网络的模糊综合评价模型,并详细介绍了模型应用的方法和步骤,最后通过实例分析,得出结论.结果表明基于IA- BP神经网络的模糊综合评价方法具有运算速度快、通用性强的特点,利用该方法对导弹并行测试系统的安全性进行评价具有可行性和客观有效性.  相似文献   

15.
输入验证型漏洞在Web安全领域颇受重视,但其在安卓安全研究领域却在很大程度上被忽视。我们发现由于安卓系统中独特的框架层设计,安卓设备需要对系统服务(System Service)进行具体的输入验证分析。本文工作对安卓系统中的输入验证型漏洞进行了分析,1)我们分析了系统服务的攻击面,介绍了目前系统服务中的输入验证的实现情况;2)我们开发了一个漏洞扫描器,通过向系统服务发送带有畸形参数的请求对其进行模糊测试。在对安卓系统中90多个服务和1900多个函数进行综合的分析后,我们发现了16个系统服务漏洞。最后,我们把这些漏洞报告给谷歌并得到了谷歌的确认。  相似文献   

16.
卷积神经网络特征重要性分析及增强特征选择模型   总被引:1,自引:0,他引:1  
卢泓宇  张敏  刘奕群  马少平 《软件学报》2017,28(11):2879-2890
卷积神经网络等深度神经网络凭借着其强大的表达能力、突出的分类性能,已在不同领域内得到了广泛应用.当面对高维特征时,深度神经网络通常被认为具有较好的鲁棒性,能够隐含地对特征进行选择,但由于网络参数巨大,如果数据量达不到足够的规模,则会导致学习不充分,因而可能无法达到最优的特征选择.而神经网络的黑箱特性使得无法观测神经网络选择了哪些特征,也无法评估其特征选择的能力.为此,以卷积神经网络为例,首先研究如何显式地表达神经网络中的特征重要性,提出了基于感受野的特征贡献度分析方法;其次,将神经网络特征选择与传统特征评价方法进行对比分析发现,在非海量样本的情况下,传统特征评价方法对高重要性特征和噪声特征的识别能力反而能够超过神经网络.因此,进一步地提出了卷积神经网络增强特征选择模型,将传统特征评价方法对特征重要性的理解结合到神经网络的学习过程中,以辅助深度神经网络进行特征选择.在基于文本的社交媒体用户属性建模任务下进行了对比实验,结果验证了该模型的有效性.  相似文献   

17.
设计了基于RBF神经网络的故障诊断专家系统,克服了在知识获取和表达上的薄弱环节,只需要领域专家解决问题的实例或范例来训练神经网络,使其在同样输入的情况下神经网络能够得到与专家给出的解答尽可能相同的输出。将测试到的结果进行分析,从结果中可以得知此系统运行状态,断路器是否出现故障及其故障类型,并根据其产生的故障原理,针对出现的问题进行相应的操作。  相似文献   

18.
在基于反汇编的输入路径追踪技术的基础上,结合基于代码覆盖的测试数据生成和基于快照恢复的错误注入技术,将其应用于模糊测试中。提出一种软件安全漏洞自动化挖掘的方法,较好地解决传统模糊技术存在的若干局限。设计并实现一个基于此方法的测试系统,通过对实例软件的漏洞挖掘实验,验证该方法的有效性。  相似文献   

19.
自动化测试通过机器运行事先准备好的测试脚本进行测试,提升了软件测试效率。然而,测试脚本存在着编写专业性强、调试工作量大、维护成本高、难以复用等问题,成为自动化测试技术难以广泛使用的主要技术瓶颈。以嵌入式系统为测试对象,提出了模型驱动的测试脚本生成方法。该方法根据BPMN2.0建模标准对测试业务流程进行可视化建模;采用路径深度覆盖算法生成测试路径,根据路径上的约束条件生成测试输入参数;通过自定义的测试动作原语将测试路径和输入参数转化为可在嵌入式系统测试平台ETest上自动执行的测试脚本。实现的原型系统支持嵌入式系统的配置项级和系统级的测试脚本生成,提高了测试工具的易用性和测试模型及脚本的可理解性、可复用性和可维护性。  相似文献   

20.
郭峰  徐建 《计算机与数字工程》2022,(12):2752-2757+2790
故障定位旨在利用程序信息以及测试用例找到程序中导致运行出错的语句,以提高程序的健壮性与安全性。论文提出了一种基于深度卷积神经网络的故障定位方法,具体而言,首先将测试用例在待检测程序上运行并收集执行覆盖信息及执行结果。然后构建一个定制的深度卷积神经网络,将收集到的信息作为训练集对神经网络进行训练。最后将事先生成的虚拟用例集作为测试集输入到神经网络模型,根据模型的输出结果来评估程序语句的错误可疑性。实验结果表明,基于深度卷积神经网络的故障定位方法显著地提高了软件故障定位的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号