首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 9 毫秒
1.
字符串相似度在自动评分系统中的应用   总被引:1,自引:0,他引:1  
在对编程语言类的自动评分系统中,程序设计类型的填空题大多采用字符串精确匹配的方法,而编程题的自动评分是一个难点.在分析两类题型的特点及目前采用的评测方法的优缺点的基础上,提出使用字符串相似度算法对程序设计题进行评判,并给出了评分过程的整体流程图.经过实际的使用,证明该方法是目前采用方法的一个很好补充,使评分的过程更加客...  相似文献   

2.
计算字符串相似度的矩阵算法   总被引:1,自引:0,他引:1  
李彬 《现代电子技术》2007,30(24):106-108,111
用2个字符串滑动比较时匹配的字符数和2字符串滑动比较的重叠率定义了相似度的衡量指标,在确定一个字符串比另一个字符串少的情况下,设计了一种算法,试验结果表明该算法实现了在字符串匹配矩阵中确定插入空格的位置使相似度指标达到最大值,并且算法的计算次数也明显地减少。该算法可以用于信息的模糊检索。  相似文献   

3.
字符串相似连接操作具有广泛应用,因而将着重研究基于编辑距离的字符串相似连接。而现有的字符串相似连接算法大多为内存算法。实际应用中的数据集越来越大,有必要针对超大规模数据集研制字符串相似性连接外存算法。利用组合频率向量划分数据集,并提出了基于编辑距离的字符串相似性连接外存算法框架,证明了磁盘调度问题的难度并提出了不同的启发式磁盘调度方法。此外,还提出了基于该外存算法框架实现字符串相似性连接增量式计算的方法。实验结果表明,数据划分方法可以有效地过滤不相关的数据子集;磁盘调度算法能够有效减少磁盘IO次数;外存算法是高效的;增量式计算方法能够高效地处理数据更新。  相似文献   

4.
语言调查采集到的数据存在相当程度的差异,需要进行二次加工。本文基于编辑距离算法实现从语言和方言词汇大数据中的词汇相似匹配及数据的对齐和定位。通过对达让语数据进行的3次实验发现,在做距离计算时,以词算而不是以词加括号内注释的整体去算的方式在保证抽取词汇召回率的基础上准确率会显著提升。实验结果表明,基于编辑距离的数据抽取方法是可行的,具有较好的检索效果。  相似文献   

5.
从大规模图像数据库中快速、有效地检索出相关图像是目前一个重要又富有挑战性的研究课题,为提高图像检索效果,提出了一种基于字符串编辑距离的图像检索算法。受图像感知哈希算法的启发,该算法首先将图像大小归一化并压缩色彩空间,并把图像特征动态映射成字符串形式,然后采用编辑距离进行字符串相似度计算从而实现图像检索。该算法不仅考虑到图像中的颜色特征,而且将字符串编辑距离引入到图像检索中,利用字符串相似度评价图像的相似性,在提高检索率的同时又加快了检索速度。采用不同类型的图像进行实验,实验结果表明,该算法具有较高的检索效率。  相似文献   

6.
从上世纪70年代开始,就有大批的学者进行了代码相似度的研究。通过研究前任的方法,我们提出了通过最长公共子序列和贪婪串匹配的方法进行计算预处理之后的代码的相似度,预处理剔除了注释和预编译指令,并把代码转换为单词串,从而保留了程序的结构这一重要属性,使得大大提升了结果的准确性,使得结果更具有参考意义。  相似文献   

7.
服务匹配已经成为服务计算领域的一大热点.合理的服务匹配算法可以帮助服务需求者寻找到满足自己需求的服务.在分析现有的服务算法基础上,提出基于混合语义相似度服务匹配方法MSSMA(Mix Semantic Similarity Matching Algorithm).将比较成熟的语义相似度算法和基于匹配等级的计算方法相结合,从而提高服务匹配的精度.  相似文献   

8.
为了改善传统FCM算法抗噪性差的问题,提出了基于自适应相似度距离的FCM算法.算法将像素分为两个特征:第一个描述的是像素的内在属性(灰度级特征),第二个描述邻域像素特征(空间特征).在此基础上,基于自适应相似度距离,根据像素在图像中的空间位置决定哪一个特征拥有优先级,对其进行聚类.图像分割结果表明,算法比标准FCM算法有明显改善,具有很好的抗噪性能,取得了更好的分割效果.  相似文献   

9.
在信息检索领域里,字符串匹配是一个被广泛而深入研究的问题.本文尝试分析几种字符串匹配算法的特点,并以此为基础,提出一种改进的Sunday算法.该算法使用先转移后匹配的策略,试图减少字符串匹配过程中无端的匹配.实验表明,本文改进的算法可以缩减匹配次数,从而使匹配效率得到进一步提高.  相似文献   

10.
李迎凯  徐小良 《电子科技》2012,25(7):69-71,75
针对基于词项的句子相似度计算存在信息冗余干扰和局部最优的缺陷,提出一种改进的基于知网的句子相似度计算方法。该方法通过增加筛选候选语句以降低冗余信息对准确度造成的干扰,同时在分词和词性标注的基础上,采用改进的带权最大二分图匹配算法获得全局最优匹配。实验结果表明,文中提出的方法有效地提高了句子相似度计算的准确度。  相似文献   

11.
近年来,基于基因本体比较基因之间的功能相似度成为一个研究热点.当前,基因功能相似度计算方法可以分为2种类型:逐对(pair-wise)比较法和成组(group-wise)比较法.然而,由于基因本体注释数据的丰度问题,造成大量的基因具有相同的本体注释数据,从而导致基因功能相似度计算方法的结果存在偏差.本文提出一种改进的基因功能相似度计算方法,对注释集合的语义信息量进行归一化,达到准确度量基因之间的功能相似度的目的.实验结果表明:本文提出的方法可以消除相同注释对基因功能相似度计算方法的影响,且在测试平台上获得非常优秀的结果.  相似文献   

12.
随着信息的快速发展,计算词语语义相似度在很多领域得到了广泛应用与研究,包括信息检索,信息抽取,词义排歧,基于实例的机器翻译,文本分类等等。本文在相关研究的基础上除了考虑路径外考虑了节点所在树中的深度和宽度,提出一种基于WordNet语义相似度的改进算法。  相似文献   

13.
本文提出了一种适用于藏文字符集的字符串匹配算法——TVM(Tibetan vowel matching)。TVM算法利用藏文拼读时的音节特点,将藏文字拆解为构件,通过元音字符查找并匹配,可以有效提高藏文字符串匹配效率。实验结果表明,本文所提算法在处理藏文字符串匹配问题时具有较高的效率,可很好地应用于藏文字取证、拼写检查器以及抄袭检测等领域。  相似文献   

14.
随着信息的快速发展,计算词语语义相似度在很多领域得到了广泛应用与研究,包括信息检索,信息抽取,词义排歧,基于实例的机器翻译,文本分类等等。本文在相关研究的基础上除了考虑路径外考虑了节点所在树中的深度和宽度,提出一种基于wordNet语义相似度的改进算法。  相似文献   

15.
随着计算机网络技术的发展,检索成为互联网中一项重要的技术。字符串搜索系统允许用户提供一段字符串作为查询条件,系统将查询条件中提取的字符串与数据库中所有的数据逐一进行比较,计算它们之间的相似度,并根据相似度值的高低排序,返回相似度值最高的字符串。根据字符串相似度度量算法的最长公共子串LCS算法和编辑距离算法的基本原理,将两种算法进行实现,并在特定的简谱字符比较应用中进行实例分析,评价两种算法的应用特点。  相似文献   

16.
费丽娟 《电子世界》2013,(12):205-206
在信息检索领域,概念间的相似度计算是实现高效率、高命中率搜索的前提。本文针对现有相似度计算方法的不足,提出一种综合的计算本体间概念相似度的方法。该方法分别计算两个概念的名称相似度、属性相似度和结构相似度,最后综合得到两个概念间的相似度,实验结果证明该方法有效。  相似文献   

17.
基于 GPU 加速的并行字符串匹配算法   总被引:1,自引:0,他引:1  
在分析了经典的串行字符串匹配算法(BF ,KMP ,BM ,BDM ,Shift -And/Shift -Or ,ZZL)基础上,对ZZL算法的预处理过程进行改进,并结合GPU的单指令多线程的并行计算特点,对ZZL算法进行并行改进,以达到处理大规模数据的速度提升。  相似文献   

18.
本文设计了一种用于多种搜索应用的基于字串特征和相似度的模糊匹配算法,阐述了该算法的设计原理,并用C语言给出了算法的代码。该算法可以根据用户指定的相似度来控制模糊程度,从而得到可控的模糊匹配结果。  相似文献   

19.
在设计盲打机考自动判卷系统时,需要一种有效的文本相似度判别算法。为此提出了一种基于局部最大相似设想的串匹配算法来解决此类问题,通过分别比较错误发生部位局部子字符串在插入片段、漏打片段或错打片段的的得分并选取失分最小者,实现了精确判定考生得分的目的。该算法无回溯,效率高,已应用于自动机考系统中。  相似文献   

20.
基于相似度的双搜索多目标识别算法   总被引:3,自引:2,他引:3  
在分析远距离多目标特性的基础上,提出了一种基于相似度的粗精双搜索多目标识别算法。在粗搜索阶段,首先利用圆形形态学模板在滤波后的二值化图像中快速搜索候选目标,再利用“距离相似度”原则进行候选目标的聚类分析,以同一目标内各候选目标点的形心位置作为局部熵处理区域中心。在精搜索阶段,以最大熵值点为种子点进行目标区域生长。为了减少运算量,提高实时性,还采用基于熵相似度、简单连接法与子区合并法相结合的改进型区域生长法,重构单个目标。仿真结果表明该算法可快速、准确地实现对5个目标的识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号