首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 65 毫秒
1.
为解决文本自动摘要任务中特征挖掘不充分的问题,选取句子的词汇、相对位置、长度和句间相似度4个特征,提出一种基于多特征融合模型的摘要系统。基于句法树的词汇特征充分利用语法信息,消除传统方法获取关键词的局限性,相对位置特征通过获取位置的高阶信息对句子进行赋值,长度特征过滤掉过长的句子,基于平滑逆向频率句嵌入方法构造句向量,有效计算句子间的相似度。实验结果表明,该系统提高了文本自动摘要的准确度。  相似文献   

2.
基于语义相似度的主观题阅卷系统模型设计   总被引:2,自引:0,他引:2  
主观题阅卷系统是一个值得研究的问题.常见的主观题评分是比对学生答案和参考答案的相似程度得出分数的.自然语言处理里面的分词技术可以将文字切分为词的组合,然后通过计算句子的语义相似度可以得出学生答案和主观题答案的相似度.在这些理论的支撑下,文章提出了一种基于.NET实现的主观题系统模型设计方法.  相似文献   

3.
多特征融合的语句相似度计算模型   总被引:1,自引:0,他引:1       下载免费PDF全文
句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。  相似文献   

4.
针对中文主观题自动评分准确率低的问题,提出一种基于doc2vec算法的主观题自动评分方法。利用doc2vec算法计算出参考答案文本和考生答案文本的文本向量,计算出两文本向量之间的相似度,然后根据相似度计算考生得分。将主观题试题作为实验数据集,用doc2vec算法进行评分,并采用方差及偏差率作为衡量标准,对基于doc2vec算法的评分结果进行验证,并与基于TextRank算法的主观题自动评分结果及人工评分进行对比,实验表明基于doc2vec算法的评分结果的方差及偏差率都较小,稳定性较好,为后期研究主观题评分有一定的参考意义。  相似文献   

5.
本文介绍和分析了主观题自动评分的国内外研究现状,在基于模糊数学中贴近度理论和单向贴近度字符串匹配方法的基础上,结合动态规划算法思想,设计并实现了基于语义脉络的自动评分算法。该算法以句子作为基本语义单元,将标准答案分解为代表得分点的词串,并为这些词串加入同义词链去匹配学生答案语句,使语义表达更加完善和准确;同时利用动态规划算法使匹配按照词的顺序进行,避免仅仅按照字的出现次数匹配所造成的机械式匹配错误;最后根据文本中句子与关键词的匹配程度给出得分。在给出基本算法的主要思想以及程序流程图的基础上,结合实例分析证明了该算法的可行性。  相似文献   

6.
该文运用多特征融合进行文本相似度的计算,并利用决策树算法C4.5进行文本分类,构建决策树分类器,完成对主观题的自动评阅。通过实验结果表明,该算法准确率高,与人工阅卷相接近,具有一定的应用前景。  相似文献   

7.
针对VSM不能揭示文档中特征词间的潜在语义关系,相似度计算准确性较低的问题,结合本体模型的结构特点,从语义重合度、语义距离以及本体结构等因素综合考虑概念间的相似度计算,提出了一种基于领域本体的文档向量空间模型。该模型通过构建概念间的语义相似度矩阵对特征词权值进行调整,建立包含语义关系的标准(学生)答案的向量空间模型,并用"VSM模型+余弦值"算法评估学生答案和标准答案的相似度。实验表明,与传统方法相比,该方法提高了评测效果及准确率。  相似文献   

8.
基于模糊理论的主观题自动评分算法研究与实现   总被引:2,自引:0,他引:2  
主观题的自动评分一直制约着考试系统的发展,通过分析阅卷教师在评阅主观题时的思维方法,在基于模糊数学中贴近度理论及其实际应用的基础上,设计一种基于模糊数学理论中带权单向匹配的算法,能有效提高主观题自动评分的准确度的问题.  相似文献   

9.
基于语句结构及语义相似度计算主观题评分算法的研究   总被引:2,自引:0,他引:2  
文字类主观题的自动评分是实现远程教育中在线考试系统的一个关键技术,由于其自动评判具有相当难度,使自动评分系统中在对语句结构、关键字匹配、词性、词义以及语义方面的判断还存在很多问题.通过对已有的算法分析,提出了一种方法,采用浅层次句法结构分析和深层次语义分析相结合的算法计算相似度,该方法可以提高主观题自动评分的效率和准确度,具有一定的实用价值.  相似文献   

10.
主观试题自动评阅系统涉及人工智能、模式识别以及计算机自然语言理解等复杂的系统知识,是无纸化考试中自动阅卷系统的设计难点。为此,仿照传统考试过程中人工阅卷的基本思路,把主观试题的自动评阅问题分解为知识库的构建、概念相似度的计算以及语句结构的处理等三部分,并把一种改进的多因素语义相似度算法引入到概念相似度计算,详细设计了主观试题的计算机自动评阅模型。实例运行结果表明,占总数70%的计算结果在可接受误差范围内。  相似文献   

11.
基于特征融合的图像情感语义分类   总被引:1,自引:0,他引:1  
基于颜色或颜色-空间信息的图像分类方法,由于没有考虑图像中所含目标对象的形状特征,分类效果不够理想,以服装图像作为数据源,提出并设计了颜色-边缘方向角二维直方图,将图像的颜色特征与形状特征融合起来进行图像分类。图像中的低阶可视化特征与高阶情感概念之间有着密切的关联,分析了服装图像的颜色和形状的融合特征与情感之间的相关性,采用概率神经网络作为分类算法来完成情感语义分类,实验结果表明,该方法的分类精度有了明显的提高。  相似文献   

12.
Most research in the automatic assessment of free text answers written by students address English language. This paper handles the assessment task in Arabic language. This research focuses on applying multiple similarity measures separately and in combination. Many aspects are introduced that depend on translation to overcome the lack of text processing resources in Arabic, such as extracting model answers automatically from an already built database and applying K-means clustering to scale the obtained similarity values. Additionally, this research presents the first benchmark Arabic data set that contains 610 students’ short answers together with their English translations.  相似文献   

13.
文本之间在相似度比较时主要考虑关键词的匹配特性,缺乏对关键词间组合关系的深入分析。针对关键词间组合特性,按序组合的关键词数目越大,对文本之间相似度贡献越大,并提出基于关键词组合数目的非线性语义关联性函数,在LCS基础上提取文本中所有关键词组合块。将这种结合关键词组合关系的相似度比较方法运用于短文本的相似度比较中,数据采用微软语义释义语料库,实验结果表明,短文本相似度计算的准确率和F1值都有了提高,其中F1值的提高较为明显。  相似文献   

14.
基于关键词与语义概念结合的信息检索研究   总被引:1,自引:0,他引:1  
张映海  何中市 《计算机应用》2006,26(12):2964-2966
对关键词和概念检索的原理进行分析后,提出了一种基于语义概念检索的向量空间模型以及该模型与关键词检索结合的检索方法。在不同的检索领域,可以通过调整该检索方法中的结合参数达到最好的检索效果。实验结果表明,语义概念检索的向量空间模型的性能优于关键词检索的向量空间模型;结合检索方法既能保留关键词检索和概念检索的优点,也能弥补各自的不足。  相似文献   

15.

针对单一特征目标跟踪算法鲁棒性较差的问题, 提出一种基于特征可分性和稳定性度量的多特征融合目标跟踪算法. 在粒子滤波框架下, 通过计算不同特征对目标和背景的可区分性和稳定性, 设置重要性权值并自适应选择区分能力强、稳定性好的特征描述目标, 建立多特征融合目标模型. 在状态转移过程中, 给出一种基于特征稳定性度量的选择性模板更新策略, 并进行遮挡处理. 实验结果表明, 所提出的算法能够在复杂场景下鲁棒地跟踪目标.

  相似文献   

16.
为解决经典证据理论在证据冲突程度高的环境下合成容易导致Zadeh悖论的问题,提出一种解决冲突证据合成问题的算法。通过计算证据间的欧几里德距离构造相异度矩阵,计算证据的相异支持度、可信度和修正率,对证据进行修正后利用合成算法进行合成。实验结果表明,该算法可以很好地解决Zadeh悖论,合成结果优于现有一些典型方法。  相似文献   

17.
袁晓峰 《计算机时代》2014,(11):40-41,43
计算文本相似度常用基于向量空间计算夹角余弦的方法,该方法忽视了同一文本中词与词之间的语义相似度,因而造成了文本表示模型的高维性以及计算的高复杂性。为此,提出了一种文本相似度算法,利用HNC理论先计算特征词之间的语义相似度,进行必要的降维,进一步计算每个文本向量中的TF*IDF值,最后计算两个向量的空间夹角余弦值并将其作为两个文本之间的相似度。将实验结果与直接计算余弦值的结果比较发现,改进后的算法中VSM的维数明显比改进前小得多,改进后的算法提高了召回率和准确率。因此,改进后的算法是切实有效的。  相似文献   

18.
藏汉机器翻译技术跟汉英机器翻译技术有所不同,其中,很重要的一个方面,藏语更依赖于格助词等虚词在句子中的作用,格助词种类繁多,用法差异很大。针对藏语格助词进行分析,在藏语短语句法树库的基础上,加入了藏语本体特征的语义信息,形成融合藏语语义信息的藏汉机器翻译方法。通过对比基于短语和句法的实验分析,该方法可以很好地应用于藏汉机器翻译系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号