首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于自然语言处理的漏洞评估方法存在概念漂移的问题,其原因是随着时间的推移对看不见的软件漏洞的评估缺乏对新术语的适当处理。为了使用软件漏洞的描述执行具有概念漂移的软件漏洞评估,提出一种结合字符和单词特征的方法。此方法用于预测7个漏洞特征,每个漏洞特征的最佳模型是使用基于时间的交叉验证方法从自然语言处理表示和机器学习模型中选择的。实验结果表明,其能有效地解决概念漂移问题,与word-only方法相比其准确度和宏平均F1分数均提高了1.7百分点,加权F1分数提高了1.3百分点,更具有竞争力。  相似文献   

2.
自然语言信息处理是人机交互的关键技术,已得到高速的发展。论文首先简单的论述了该技术的起源以及发展,然后重点研究了该技术在文本和语音方面的广泛应用。可以预测随着计算机技术的进一步发展,自然语言信息处理技术将被应用到更加广泛的领域。  相似文献   

3.
自然语言信息处理是人机交互的关键技术,已得到高速的发展.论文首先简单的论述了该技术的起源以及发展,然后重点研究了该技术在文本和语音方面的广泛应用.可以预测随着计算机技术的进一步发展.自然语言信息处理技术将被应用到更加广泛的领域.  相似文献   

4.
随着计算机信息技术的不断发展,各类软件已被人们广泛应用到社会生活、生产的各个领域。但是,随着信息系统漏洞的不断增多,病毒种类的千变万化,软件安全却一直是人们感到棘手的难题。在信息技术发展的同时,近20多年新兴的机器学习也在蓬勃的发展,并且已经在很多领域得到成功的应用。本文先分析机器学习的主要策略,再分析当今软件安全的现状,最后再探索在软件安全中结合语义的机器学习方法。  相似文献   

5.
软件构架是软件工程中的重要研究领域,对软件大型复杂系统具有重要意义。采用恰当的构架是项目成功的第1步,所以好的软件构架及其评估是系统开发的关键所在。对软件构架的基本原理和结构进行了探讨,并对评估及评估方法做出了详细评析。在软件开发过程中采用软件构架,会为提高软件质量以及降低软件成本提供有力保障。  相似文献   

6.
叶明 《网管员世界》2013,(22):36-36
本人所在单位是国有电信行业的一家地市级分公司,现有在职人员1000多人,终端数量也超过1000台,内部网络使用私有地址,与互联网隔离,在网络边界部署了,终端自身的安全则主要靠一些免费的安全工具与防病毒软件。  相似文献   

7.
在软件开发早期获取软件安全(Security)需求可以有效减少软件安全问题的发生.传统的安全需求获取方法大多依赖安全领域的专家知识,需要手工执行,且获取的安全需求模型对相关安全标准的符合性缺乏考虑.本文阐述了一种从英文自然语言描述的需求文本中自动获取安全需求的方法:首先,基于自然语言处理技术抽取英文需求中的实体(如资产)以及实体关系(如用户对资产的操作);然后,采用基于深度学习的多标签文本分类模型预测需求的安全目标集;最后,通过匹配获得并实例化基于通用标准(CC:Common Criteria)的安全需求模板.此外,本文通过一组基于安全目标的多标签需求文本分类实验,选择出实验指标最优的深度学习模型:BERT-TextCNN,并将其应用到支撑本文方法的工具中.  相似文献   

8.
唐寅  何嘉 《计算机工程与设计》2021,42(11):3052-3058
为减少传统安全设备实现安全功能灵活性差、部署成本高等弊端,深入研究软件定义网络(SDN)、网络功能虚拟化(N F V)和基于软件定义的安全服务部署技术,建立安全服务链部署模型,提出一种启发式算法.从节点的安全功能需求、物理资源需求,以及节点之间的网络资源需求和传输时延等方面综合评估部署安全功能服务链的资源需求,优先部署资源需求较大的安全功能服务链,避免资源能力成为瓶颈.实验结果表明,该算法可有效提升部署成功率.  相似文献   

9.
Web应用已成为互联网和企事业单位信息管理的主要模式。随着Web应用的普及,攻击者越来越多地利用它的漏洞实现恶意攻击,Web应用的安全评估已成为信息安全研究的热点。结合Web应用的业务逻辑,提出了其相关资源软件攻击面的形式化描述方法,构造了基于软件攻击面的攻击图模型,在此基础上,实现对Web应用的安全评估。本文构造的安全评估模型,在现有的通用漏洞检测模型基础上,引入业务逻辑安全性关联分析,解决了现有检测模型业务逻辑安全检测不足的缺陷,实现了Web应用快速、全面的安全评估。  相似文献   

10.
在软件工程领域摹于公式模型预测的结果往往并不比人的经验准确,然而基于经验的预测方法也存在不少问题.提出的软件项目费用风险评估方法基于专家知识经验和历史项目数据,综合利用功能点分析方法以统计或估箅项目的大小,建立了由专家评估预测费用超出的BN模型,由历史数据得到费用超出与生产力之间的关系,从而计算计划项目的生产力.进而估计项目的计划费用,通过对项目当前生产力与计划生产力的比较,评估项目当前是否存在费用风险.方法与费用预测模型无关,费用预算和项目最终实际费用以相对应的理想项目费用为参照物,与在不确定性费用预算基础上进行费用风险分析评估的方法相比,具有较高的可靠性.  相似文献   

11.
王潮  徐卫伟  周明辉 《软件学报》2024,35(2):513-531
代码注释作为辅助软件开发群体协作的关键机制,被开发者所广泛使用以提升开发效率.然而,由于代码注释并不直接影响软件运行,使其常被开发者忽视,导致出现代码注释质量问题,进而影响开发效率.代码注释中存在的质量问题会影响开发者理解相关代码,甚至可能产生误解从而引入代码缺陷,因此这一问题受到研究者的广泛关注.采用系统文献调研,对近年来国内外学者在代码注释质量问题上的研究工作进行系统的分析.从代码注释质量的评价维度、度量指标以及提升策略这3个方面总结研究现状,并提出当前研究所存在的不足、挑战及建议.  相似文献   

12.
为了满足科技政策研究需要,中国科协设计并实现了一种科技政策库系统.本文首先介绍了科技政策库的总体设计方案、系统工作流程;然后详细介绍了系统组成,整个系统由数据采集子系统、数据清洗子系统、数据分析子系统3个子系统组成.数据采集子系统基于网络爬虫框架Scrapy软件针对大量异构站点设计了可管理的网络爬虫,并基于ABBYY FineReader软件(俄罗斯软件公司ABBYY发行的一款文档识别软件)实现了历史文献OCR识别(Optical Character Recognition,光学字符识别)和入库.数据清洗子系统基于机器学习算法实现了数据去重、非相关数据识别、数据属性缺陷识别等功能.数据分析子系统则对有效入库的科技政策进一步进行了文本分类、关联关系分析、全文检索.从2018年10月上线以来,该系统从226个数据源采集564 749条数据,经过数据清洗之后入库404 083条数据,能够有力地支撑科技政策研究工作.  相似文献   

13.
自动文摘系统中一个关键的问题是找出能构成摘要的重点句子。找出这些句子的方法很多,但用机器学习的方法却较少,该文提出了一种关于文摘句式的自动学习方法。该方法以经过简单的预处理的若干语句为训练样本集,以正例句为基点进行由底向上的泛化学习,抽象出关于句式的一般概念,形成句式规则集,作为判断文中哪些语句可作为文摘句的有效手段。这是文摘系统实现的核心部分。  相似文献   

14.
    
Stance detection aims to automatically determine whether the author is in favor of or against a given target. In principle, the sentiment information of a post highly influences the stance. In this study, we aim to leverage the sentiment information of a post to improve the performance of stance detection. However, conventional discretemodels with sentimental features can cause error propagation. We thus propose a joint neural network model to predict the stance and sentiment of a post simultaneously, because the neural network model can learn both representation and interaction between the stance and sentiment collectively. Specifically, we first learn a deep shared representation between stance and sentiment information, and then use a neural stacking model to leverage sentimental information for the stance detection task. Empirical studies demonstrate the effectiveness of our proposed joint neural model.  相似文献   

15.
随着网络的发展和普及,人们对于安全性、匿名性、反审查等信息安全的需求快速增强,越来越多的人开始关注和研究Tor匿名通信网络。目前针对Tor网络内容监控的研究工作大部分存在功能少、性能弱等劣势,如缺乏为暗网设计的专用爬虫,网络连接速度较慢,本文设计开发了一套综合性的Tor网络内容动态感知及情报采集系统,包含数据采集爬虫以及网页内容分类两个部分。其中爬虫部分使用了分布式架构,包括了任务管理模块、爬虫调度模块、网页下载模块、页面解析模块、数据存储模块,同时创新性地优化了Tor连接链路以提高爬取速度和稳定性;网页内容分类部分使用了自然语言处理技术,建立训练模型并对抓取到的信息进行精准高效分类,解决分类的准确度和复杂性问题,最后根据结果分析暗网的内容结构和敏感信息。我们也相应地为保障系统运行设计了容错模块和预警模块,从而对系统各个组件的当前状态进行实时监控,并将系统的状态数据进行整合、收集和展示。最后我们将该系统放到了实际Tor网络环境中进行了测试,从系统网页爬取效果、内容分类效果及系统性能等三方面进行了评估和分析,并与国内外7中现有的框架的功能进行了对比,证明本文提出的方案在暗网域名、网页、数...  相似文献   

16.
This paper reports our investigation of machine learning methods applied to anaphora resolution for biology texts, particularly paper abstracts. Our primary concern is the investigation of features and their combinations for effective anaphora resolution. In this paper, we focus on the resolution of demonstrative phrases and definite determiner phrases, the two most prevalent forms of anaphoric expressions that we find in biology research articles. Different resolution models are developed for demonstrative and definite determiner phrases. Our work shows that models may be optimized differently for each of the phrase types. Also, because a significant number of definite determiner phrases are not anaphoric, we induce a model to detect anaphoricity, i.e., a model that classifies phrases as either anaphoric or nonanaphoric. We propose several novel features that we call highlighting features , and consider their utility particularly for processing paper abstracts. The system using the highlighting features achieved accuracies of 78% and 71% for demonstrative phrases and definite determiner phrases, respectively. The use of the highlighting features reduced the error rate by about 10%.  相似文献   

17.
单词嵌入是指运用机器学习的方法,将位于高维离散空间(维数为词典单词数目)中的每个单词映射到低维连续空间的实数向量的技术。在很多文本处理的任务中,单词嵌入提供了更好的语义级别的单词特征表示,从而为文本处理任务带来了诸多便利。同时,大数据时代海量的未标注文本数据,以及以深度学习为代表的机器学习技术的发展使高效的单词嵌入技术成为可能。本文将给出单词嵌入的定义以及实际意义,同时将综述目前单词嵌入技术的几种典型方法,包括基于神经网络的方法、基于受限玻尔兹曼机的方法以及基于单词与上下文共生矩阵分解的方法。本文将详细介绍不同模型的数学定义、物理意义以及训练方法,并给出他们之间的比较。  相似文献   

18.
CM-Builder: A Natural Language-Based CASE Tool for Object-Oriented Analysis   总被引:3,自引:0,他引:3  
Graphical CASE (Computer Aided Software Engineering) tools provide considerable help in documenting the output of the Analysis and Design stages of software development and can assist in detecting incompleteness and inconsistency in an analysis. However, these tools do not contribute to the initial, difficult stage of the analysis process, that of identifying the object classes, attributes and relationships used to model the problem domain. This paper describes an NL-Based CASE tool called Class Model Builder (CM-Builder) which aims at supporting this aspect of the Analysis stage of software development in an Object-Oriented framework. CM-Builder uses robust Natural Language Processing techniques to analyse software requirements texts written in English and constructs, either automatically or interactively with an analyst, an initial UML Class Model representing the object classes mentioned in the text and the relationships among them. The initial model can be directly input to a graphical CASE tool for further refinement by a human analyst. CM-Builder has been quantitatively evaluated in blind trials against a collection of unseen software requirements texts and we present the results of this evaluation, together with the evaluation method. The results are very encouraging and demonstrate that tools such as CM-Builder have the potential to play an important role in the software development process.  相似文献   

19.
基于知觉加工模式的发展式分词算法   总被引:2,自引:0,他引:2  
危辉 《计算机研究与发展》2001,38(11):1281-1289
分词是自然语言理解的一个重要过程,由于语言问题又是最重要的心理学问题之一,所以从认知心理学和发展心理学的观点出发,将分词问题看成是知觉问题在语言信息处理过程中的一部分,把知觉表达和知觉的双向加工过程引入对分词问题的分析,并同时考虑言语发展的心理过程,把对言语发展规律的归纳作为构造学习算法的基础和模板,以进化的方式来逐步改进自然语言理解系统的性能,从而避免知识获取瓶颈在自然语言理解问题中的出现。  相似文献   

20.

提出大语言模型安全通用基准测试集—JADE-DB,该数据集基于靶向变异方法自动化构建,能够将经验丰富的大语言模型安全测试员和多学科专家学者手工撰写的测试问题转化为高危通用问题,保持语言自然性的同时不改变其核心语义,且能够攻破十余款国内外知名大语言模型的安全防护机制. 根据语言复杂性差异,JADE-DB包含基础、进阶、高危3个安全测试等级,共计上千条覆盖违法犯罪、侵犯权益、歧视偏见和核心价值观4大类违规主题、30多种违规主题的通用测试问题,其中针对国内开源(中文,8款)、国内商用(中文,6款)和国外商用大语言模型(英文,4款)这3组大语言模型分别构建的3款通用高危测试集,可造成每组模型在高危测试集上的平均违规率均超过 70%,测试问题均可同时触发多款模型违规生成. 这表明,语言的复杂性导致现有大语言模型难以学习到人类无穷多种表达方式,因此无法识别其中不变的违规本质.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号