首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
从学术论文抄袭的现象和危害出发,分析归纳了学术论文抄袭的主要类型及形式。接着从论点抄袭、文本抄袭、算法与程序代码抄袭和图片与公式抄袭等几个方面,综述了近阶段所采用的主要抄袭检测方法。最后概述了解决论文抄袭检测问题的重要意义,并对如何防止学术论文抄袭提出建议。  相似文献   

2.
软件开发维护过程中产生的缺陷报告中常常出现大量的重复缺陷报告。自动准确地检测出重复缺陷报告,将为软件缺陷的分派、修正、再测试等工作节约大量宝贵的开发维护成本。文章基于传统的向量空间模型检测方法,提出一种新的基于N-gram模型的重复缺陷报告检测方法,文中第2小节中详细介绍了该方法的细节。通过在小数据集上的实验,明确了在使用该方法检测重复缺陷报告时,参数N取3/4/5,利用全句法仅针对缺陷报告的概要信息进行相似度计算将取得较好的效果。最终使用一个含有4 503条Firefox缺陷报告的数据集对该方法进行了验证。实验证明N-gram模型法与向量空间模型法相比,重复缺陷的查全率(Recall Rate)提高了25%~55%。  相似文献   

3.
现有的抄袭检测模型主要是基于启发式的源检索查询生成方法,没有根据抄袭检测任务本身进行建模.文中设计实现了一个基于统计机器学习方法的实验报告抄袭检测系统,该系统使用基于逻辑回归模型从可疑文本片段对中提取词法特征、语法特征、语义特征和结构特征,并通过自动获得的抄袭语料进行不断训练和模型更新.实践证明,通过基于统计机器学习的...  相似文献   

4.
抄袭源是指1篇被检测文档中抄袭的部分所在的文档集合,抄袭检测源检索的任务就是检测文章时,用最小的代价检测出尽可能多的潜在抄袭源。通过对中文抄袭检测源检索方法的研究,探索基于web的中文抄袭源检索的解决策略、具体方法和技术。  相似文献   

5.
文章在全面分析软件系统安全性缺陷的基础上,提出一种基于相似特征的软件安全性缺陷检测算法.针对C语言源代码,应用实例推理CBR的技术原理,通过检测算法将源代码的安全特征与已知安全性缺陷的实例特征进行相似匹配,通过相似度计算来判定软件代码是否存在安全性缺陷.实验表明该算法有效地提高了缺陷检测的准确性和效率,解决了现有基于规则匹配的检测方法不能快速而准确地处理大型遗产软件和结构较为复杂的软件的问题.同时阈值的定义和选择也提高了检测算法的适应性和灵活性.  相似文献   

6.
BLEU是一种经典的机器翻译质量评估方式。如果应用于英汉翻译测试的自动评分系统研究中,能够解决传统的人工评分存在评分完全依赖于评分员主观评判的问题。本文在简单介绍了BLEU评分法的核心思想的基础上,模拟设计出英语考试翻译自动评分系统实施方案,说明建立翻译自动评分系统具有一定的可实施性。  相似文献   

7.
针对未知恶意代码数量急剧增长,现有的检测方法不能有效检测的问题,提出一种基于属性相似度的恶意代码检测方法.该方法将样本文件转换成十六进制格式,提取样本文件的所有n-gram,计算每个n-gram的信息增益,并选择具有最大信息增益的N个n-gram作为特征属性,分别计算恶意代码和正常文件每一维属性的平均值,通过比较待测样本属性与恶意代码和正常文件两类别属性均值的相似度来判断待测样本类别.结果表明,该方法对未知恶意代码的检测性能优于基于n-gram的恶意代码检测方法.  相似文献   

8.
首先针对不同的条件属性类型,分别给出两对象关于条件属性的相似度,然后给出了t相似度的概念,最后分别就条件属性是离散、连续、序数型的决策表给出了相应的完备化(补齐)算法.实例表明此完备化方法是行之有效的.  相似文献   

9.
针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的蒙古语做出有效的翻译,并在一定程度上提高翻译质量,在蒙汉机器翻译中具有较好的应用价值.  相似文献   

10.
提出了在彩色环境下检测椭圆的新算法。首先分析了椭圆的解析结构,根据物理学中惯性矩的概念,推演出一个类椭圆区域的理想椭圆,用该理想椭圆与边缘检测获得的边缘点拟合,求出一个区域的理想椭圆;然后将求得的理想椭圆与区域边缘点集合用近似度和逼近度两个指标拟合,得到与类椭圆区域最匹配的精确椭圆;最终得到类椭圆区域的边界轮廓,该轮廓可以很好地代替目标的真正边界。该算法可以快速检测完整椭圆和椭圆弧。  相似文献   

11.
情感计算是对文本进行情感分析与挖掘,得出文本评价调性的过程。基于知网的情感计算方法首先依据知网"情感分析用词语集"构建情感词典,然后计算文本中特征词汇的情感倾向,最后通过累加得出文本的情感倾向。实验结果表明,在设定一个合理中性阀值后,能较好地计算出特征词汇和篇章的情感倾向,有较高的查全率和查准率。  相似文献   

12.
NVIDIA公司提出的CUDA技术通过并发执行多个线程以实现大规模快速计算的能力。在研究CUDA技术在数字图像处理领域应用的基础上,提出了一种基于NVIDIA CUDA的方法实现图像边缘检测,把CUDA技术的快速计算的能力应用到数字图像处理领域。从CUDA技术的概况的介绍出发,对基于NVIDIA CUDA的图像边缘检测方法以及该方法的详细实现过程进行了形式化的描述,解决了基于CPU的传统图像边缘检测方法运行效率低的问题。实验结果证明CUDA在数字图像处理的实际应用中卓有成效。  相似文献   

13.
基于时间序列相似度的离群模式检测模型   总被引:2,自引:0,他引:2  
针对常规基于单点数据比较的离群模式检测忽视现实生活各种波动周期规律的问题,提出采用时间序列相似度的检测方法.通过基于重要点的时序线段拟合方法描述整体波动规律,以线段斜率比较描述时序走势的相似度.模型克服了一般时序分析算法复杂度高、缺乏整体波动规律把握的缺陷,可以有效解决目前可疑金融交易监管系统高误报率、报送数据调查价值低的问题.对金融外汇交易真实数据的实验结果证实了模型在交易波动周期规律发现上的有效性.  相似文献   

14.
针对网络异常检测虚警率偏高的问题,提出了一种基于属性相似度云模型的网络异常检测新方法。基于各属性对分类的不同贡献,结合数据对象空间和属性空间的相似度概念,给出了属性相似度和属性权重的计算方法,该方法可降低网络数据空间的维数,提高目标识别的准确率。试验表明,该方法具有先验知识需求少和参数容易确定的优点,能比较准确地检测出对网络数据的异常行为。  相似文献   

15.
闭环检测是视觉SLAM中很重要的一部分,成功地检测出闭环能减小定位算法所产生的累积里程漂移.鉴于深度卷积神经网络在分类问题上的优越表现,本文首次将应用于图像分类的vgg16-places365卷积神经网络模型应用于视觉SLAM闭环检测中,将配准数据输入训练好的该卷积神经网络,其各个隐藏层的输出对应于图像特征表示.然后通过实验比较选用匹配精度较高的中间层完成场景特征提取,通过计算场景特征的相似性得到闭环区域.最后在闭环检测数据集上进行实验测试.测试结果表明,相比于传统的闭环检测方法,vgg16-places365卷积神经网络模型在相同召回率条件下准确率要高约3%;对于特征提取时间,在CPU上要快约5~10倍,而在GPU上更是比传统人工设计特征的闭环检测快近100倍.  相似文献   

16.
词语权重计算是自然语言处理中的重要问题,是文档语义表示的重要实现手段.词语的权重主要由两部分决定,一部分是词语在文档中的重要性度量,另一部分是基于统计方法所得的词语在区分不同文档能力上的度量即词语全局权重.本文就针对有相对稳定性的词语全局权重计算方法分析比较了现有的几种词语全局权重计算方法,并在此基础上提出了一种新的组合词语全局权重计算方法,实验证明本文提出的新方法能够有效地提高了系统的性能.  相似文献   

17.
可扩展标记语言正在成为Web上各种应用交换信息的标准。对高性能可扩展标记语言数据处理技术的需求正日益增长。现有的大部分可扩展标记语言文档相似度计算方法是基于文档结构特征的。该文提出了一个新的基于综合语义的可扩展标记语言文档相似度计算方法。该方法综合利用了可扩展标记语言文档的结构信息和内容信息,具有一定应用前景。  相似文献   

18.
针对现有基于流量特征的DDoS泛洪攻击检测方法易被攻陷,且难以区分攻击与突发访问事件(flash crowds)等问题,提出了一种泛化的攻击检测策略。在此基础上,分别构建泛洪行为和泛洪攻击两种流指纹,通过目标超点聚合度定位泛洪行为,采用一种滑动判别算法区分泛洪攻击与flash crowds事件。实验结果表明,该检测方法可以有效检测泛洪攻击。由于该方法只需维护流到达信息,对于实现高速网络环境下的攻击检测具有一定的实际意义。  相似文献   

19.
为了提高人脸检测的速度和精度,提出了一种基于肤色分割与改进的AdaBoostSVM算法相结合的人脸检测方法。首先在YCgCr空间通过计算肤色相似度进行肤色分割,进而得到候选的人脸区域。然后,针对人脸检测中正负样本的非对称性对AdaBoostSVM算法进行改进,并用改进的AdaBoostSVM算法对候选人脸进行检测验证。实验结果表明,该方法改善了人脸检测性能,提高了检测速度,能够在复杂背景下进行快速而且较为准确的人脸检测。  相似文献   

20.
感兴趣区域的确定及相似度计算方法   总被引:1,自引:1,他引:0  
对ROIBIR系统中ROI的确定及区域相似度计算进行了研究.首先介绍了两种确定ROI的方法,它们充分利用分割区域的用户可见性、区域及其权重用户的可指定性来实现用户的可选性.使图像的检索系统融合人的感知能力,符合人们的检索习惯.然后介绍了一种基于区域的图像相似度计算方法,这种方法先分别按照区域的综合特征、直方图特征值及区域的形状特征进行相似度计算,再将各自相似度加权乘积作为两区域的相似度,各区域最大相似度的平均值作为感兴趣区域与目标图像的相似度.并用实验证明了提,出方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号