首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
语句相似度计算在FAQ中的应用   总被引:1,自引:1,他引:1  
语句相似度主要用以衡量两个语句的相似程度。语句相似度计算方法应用于FAQ中,能够提高查找问题的精确性。文章提出的基于单字的倒排索引相似查找算法能够提高查找速度。  相似文献   

2.
针对网络考试系统中主观题自动评分面临的困难和问题,提出一种基于中文分词技术结合语句相似度的主观题自动判分算法.该算法利用字典与统计相结合技术将语句切分成具有独立意义的单词,通过计算词与词之间的相似度,并结合词形、词序和语句长度等多层次相似度计算得到整句的相似度.利用语句相似度计算结合改进关键字匹配算法得到最终分值.经课题中多媒体简答题的测试,结果表明了该算法的有效性.  相似文献   

3.
主观题阅卷技术是计算机自动阅卷中的关键技术。国内外专家都致力于自动批改技术的研究,但成熟应用的系统很少。语句相似度计算是主观题自动阅卷的关键问题,本文结合格语法进行语义分析,在此基础上设计语句相似度算法,能有效提高评分准确率。  相似文献   

4.
改进的概念语义相似度计算   总被引:2,自引:0,他引:2  
在相似度计算中,本体能够将各种概念及相互关系明确地,形式化地表达,因而发挥着重要的作用.为了使相似度计算结果更为精确,考虑更全面的利用本体中的关系,和相似度计算在特定领域中应用的特点,提出一个改进的相似度计算模型.利用上下位关系计算相似度,非上下位关系计算相关度,将二者合成,并同时考虑语义检索领域中,相似度计算的不对称性.经过实验验证了该方法有效且精确.  相似文献   

5.
为了实现制造资源本体之间的语义互操作,对本体中的概念进行语义相似性计算为进行此操作的关键技术之一。本文提出了一种计算概念语义相似度的新方法,将概念语义相似度分为两部分:主体相似度和附加相似度。主体相似度综合考虑了概念自身的相似度,该概念的父概念和子概念间的相似度,以及概念间的二元关系,同时,加入了概念属性相似度,属性携带了概念的大部分语义信息,计算属性相似度可以有效提高概念语义相似度的准确性。附加相似性是指通过本体中概念的层次结构对主体相似度进行语义补充,利用概念的深度对得到的概念语义相似度进行语义调整,有效的弥补了仅仅利用主体相似度计算概念语义相似度的不足。最后,通过实例证明了该方法的有效性。  相似文献   

6.
一种综合的本体相似度计算方法   总被引:6,自引:1,他引:5  
本体相似度计算是本体映射的关键环节.本体的实例、关系、属性、结构等信息是相似度计算需要考虑的重要因素.针对目前本体映射过程中相似度计算所存在的问题,提出了一种综合的相似度计算方法.首先判断不同本体之间是否存在相关性.若相关,则充分考虑各种相关因素,从语义和概念两个层面来进行比较,然后给出了本体的综合相似度计算方法.最后采用了两组测试数据对该方法进行实验,并与GLUE系统的概率统计方法进行了实验对比.实验结果表明,该方法能够有效确保相似度计算的准确性.  相似文献   

7.
针对目前本体映射过程中相似度计算存在的问题 ,提出了一种综合的相似度计算方法。首先判断不同本体之间是否存在相关性 ,若相关 ,则充分考虑各种相关因素 ,从语义和概念两个层面来进行比较 ;然后给出本体的综合相似度计算方法 ;最后采用两组测试数据对该方法进行实验 ,并与 GLUE系统的概率统计方法进行了实验对比。实验结果表明 ,该方法能够有效确保相似度计算的准确性。  相似文献   

8.
概念与文档的语义相似度计算   总被引:1,自引:0,他引:1  
将本体作为背景知识引入到概念之间相似度和文档之间相似度的计算中。通过图模型表示本体中概念以及概念之间的语义关系,用来将一个概念和一个文档扩展为一个语义模糊集,并计算模糊集合之间的相似度。文档相似度的计算是在概念相似度计算的基础之上。在概念相似度的计算过程中引入了语义相似度矩阵以及基于共信息理论的模糊相似度方法。  相似文献   

9.
为提高中文短文本相似度计算的准确率,提出一种新的基于混合策略的中文短文本相似度计算方法。首先,根据词语的语义距离,利用层次聚类,构建短文本聚类二叉树,改进传统的向量空间模型(VSM),计算关键词加权的文本相似度。然后,通过提取句子的主干成分对传统的基于语法语义模型的方法进行改进,得到文本主干的语义相似度;最后,对两种相似度进行加权,计算最终的文本相似度。实验结果表明,提出的方法在短文本相似度计算方面准确性更高,更加适合人们的主观判断。  相似文献   

10.
在语句语义相似度计算的算法中,没有考虑语句中的不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想。为此提出了基于频率函数的改进词语相似度算法,该算法将词语在语料库中的频率函数作为权重值,引入至语句的词语相似度计算中,以降低高频率词语在语句相似度值中的比重,提高算法精确率。由于当前审计方法存在散、乱、重复等现象,为了更好地复用已有的审计方法,将根据审计方法建立审计规则库,在此基础上,利用上述改进的语义相似度算法,计算用户输入与审计规则之间的相似度值,返回满足相似度阈值条件的审计规则所对应的审计方法,用户根据所返回的审计方法,选择合适的审计方法进行审计工作。实际应用表明,该算法的应用减少了人工搜索审计方法的时间,提高了审计效率。  相似文献   

11.
在基于实例的维吾尔语汉语机器翻译系统中维吾尔语相似度计算起重要作用。维吾尔语的黏着性特性要求对单词进行词干提取。本文提出的方法结合简单的句子结构相似度计算方法,通过对单词词干提取进行句子相似度计算。小规模实验结果比较接近人工评价的句子相似度。  相似文献   

12.
句子相似度的计算在自然语言处理的各个领域占有很重要的地位,一些传统的计算方法只考虑句子的词形、句长、词序等表面信息,并没有考虑句子更深层次的语义信息,另一些考虑句子语义的方法在实用性上的表现不太理想。在空间向量模型的基础上提出了一种同时考虑句子结构和语义信息的关系向量模型,这种模型考虑了组成句子的关键词之间的搭配关系和关键词的同义信息,这些信息反应了句子的局部结构成分以及各局部之间的关联关系,因此更能体现句子的结构和语义信息。以关系向量模型为核心,提出了基于关系向量模型的句子相似度计算方法。同时将该算法应用到网络热点新闻自动摘要生成算法中,排除文摘中意思相近的句子从而避免文摘的冗余。实验结果表明,在考虑网络新闻中的句子相似度时,与考虑词序与语义的算法相比,关系向量模型算法不但提高了句子相似度计算的准确率,计算的时间复杂度也得到了降低。  相似文献   

13.
句子相似度是衡量文档相似度的基础,在自然语言处理领域中有着非常重要的作用。目前的句子相似度计算方法忽略了句子的结构对相似度的影响。本文在分析已有研究工作的基础上,提出了一种改进的句子相似度计算方法。依据知网对"实体概念"的描述,构造出义原的语义层次树,由各个义原在树中的相对位置,计算出义原之间的相似度。对三种义原加权求和得到词语之间的语义相似度。综合句子的表层相似度和句子的词语语义以及词语的相对位置关系,得到句子的整体相似度。实验表明,在同等的测试条件下,本文所提出的句子相似度计算方法在相似度比较上更符合人的直观感觉。  相似文献   

14.
针对当前主要的汉语句子相似度计算方法存在的问题,通过对大量的中文语句进行构式语义分析,提取构式语块特征,构建构式义特征库,并提出了一种基于构式语块的中文句子相似度计算方法.该方法最大化语块粒度,缩小语义理解间隙.在计算时,首先,通过自上而下语块分析方法,利用HMM学习算法,对复杂多样的汉语句子进行构式语块识别;然后,采用自底向上的计算方式,获取得到构式块间的相似度;最后,计算得出句子间的相似度量值.对比句子相似度实验结果表明,论文提出的计算方法优于其他算法.  相似文献   

15.
一种基于知网语义相似度计算的应用研究   总被引:1,自引:0,他引:1  
随着常见问题集(FAQ)的积累,问句数量日益增大,逐页浏览的知识获取方式很难满足用户的实际需求,也浪费用户大量的精力和时间,而基于FAQ的自动问答系统是解决该问题的一种有效途径。本文设计了QuickFaq自动问答系统框架,采用基于知网的语义相似度计算模块,找出相似问句并返回答案。实验表明,该方法提高了问答系统的召回率和不匹配率。  相似文献   

16.
句子相似度计算是信息处理领域一项基础技术,在基于实例的机器翻译中直接影响译文质量。该文以韩国语句子为研究对象,结合韩国语的句子特点提出了一种句子结构相似度的计算方法。该方法通过先提取句子的骨架结构,然后结合韩国语的句法特点制定标记转换规则,最后用转换后的句子结构与实例库中句子匹配得到与之相似的句子,得出两个句子间的结构相似度,并且通过实验验证了该方法的可行性,提高了相似度计算效果。  相似文献   

17.
提出了一种计算英文句子间相似度的方法。基于句子所传递的信息——其描述的对象、描述对象的属性和动作,首先将待比较的两个句子进行语块分析,并从中提取以上三个方面的信息;然后通过语义向量的方法,分别计算两个句子在这三个方面的相似度;最后将它们结合起来作为两个句子的整体相似度,并通过训练得到最优的结合参数。实验表明,提出的方法与目前计算句子间相似度的方法相比更加符合人工判断句子间相似度的过程,表现出更高的准确性,达到了较高的性能指标。  相似文献   

18.
基于问句相似度的中文FAQ问答系统   总被引:5,自引:0,他引:5  
常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存储好的问题答案。通过对常见问句特点的研究,给出一种基于分解的向量空间模型和语义概念的问句相似度计算方法,其主要思想是对一个问句向量进行分解,提取其三个关键部分:问点、主题词和疑问词,表示成三个分向量,然后对每个分向量计算基于《HIT-IRLab同义词词林(扩展版)》的语义相似度,通过线性加权就可以得出两个问句的语义相似度。试验表明,与传统的基于向量空间模型的TF-DF问句相似度计算方法相比,可以提高问句匹配的精度。  相似文献   

19.
多特征融合的语句相似度计算模型   总被引:1,自引:0,他引:1       下载免费PDF全文
句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。  相似文献   

20.
文字类主观题的自动批改是在线考试系统的一个关键技术。本文在研究主观题自动批改技术现状的基础上,提出了一种基于向量空间模型的短语级句子相似度计算方法,并基于该计算方法设计了一种主观题自动批改算法,经验证,实验结果基本达到预期目标。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号