首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
刘磊 《计算机应用与软件》2021,38(12):193-200,206
通过集成学习方法,探索影响英语学习者作文质量的语言特征,提高现有作文自动评分系统的准确率.基于剑桥FCE考试数据集,使用支持向量回归和随机森林算法筛选特征,构建并评测自动评分模型.与现有方法对比实验的结果表明,基于集成学习的评分模型准确率有所提升.该方法可以有效评估英语学习者的作文质量,有助于开发面向大规模机考和网络自主学习平台的作文自动评阅系统.  相似文献   

2.
作文特征选取是研究汉语作为第二语言的水平测试自动作文评分的关键问题之一,以中国汉语水平考试作文为研究对象,从字、词、语法、成段表达、庄雅度等多个层面上,选取107个作文特征,经相关度计算得到19个与作文分数较为相关的作文特征。基于选取的作文特征,采用多元线性回归方法进行回归实验和稳定性交叉实验。实验表明,作文长度、词汇使用和成段表达方面的作文特征对作文得分具有较好的解释能力,多元线性回归方法应用于中国汉语水平考试自动作文评分具有较好的稳定性。  相似文献   

3.
目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法 MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理长序列文本时无法准确捕捉到符合上下文语境的向量嵌入,提升动态向量语义表征质量,解决一词多义问题,并通过一维卷积模块提取不同尺度的短语级别嵌入。多尺度上下文网络通过结合内置自注意力简单循环单元和全局注意力机制,分别捕捉单词、短语和句子级别的作文高维潜在上下文语义关联关系,利用句向量与作文主题计算语义相似度提取篇章主题层次特征,将所有特征输入融合层通过线性层得到自动评分结果。在公开的标准英文作文评分数据集ASAP上的实验结果表明,MSC模型平均二次加权的Kappa值达到了80.5%,且在多个子集上取得了最佳效果,优于实验对比的深度学习自动评分模型,证明了MSC在英文作文自动评分任务上的有效性。  相似文献   

4.
利用自然语言处理技术对作文进行自动评阅是有重要意义和挑战的研究课题,引起了人工智能领域与教育领域学者的共同关注。该文聚焦于语文作文自动评分任务,提出通过深层语言分析,包括应用高性能别字、语法纠错器分析语言运用能力,采用自动修辞分析、优秀表达识别等手段反映语言表达能力,以及通过细粒度篇章质量分析评估篇章整体质量,来构建有效特征。该文同时提出了结合语言分析特征与深度神经网络编码的自适应混合评分模型。在真实语文作文数据上的实验表明,融入深层语言分析特征可有效提高作文评分效果;年级与主题自适应的模型训练策略,可提高模型的迁移能力和预测效果。消融实验进一步分析和解释了不同类型特征对评分效果的贡献。  相似文献   

5.
周险兵  樊小超  任鸽  杨勇 《计算机应用》2021,41(8):2205-2211
作文自动评分(AES)技术能够自动地对作文进行分析和评分,其已成为自然语言处理技术在教育领域应用的热点研究问题之一。针对目前AES方法割裂了深层和浅层语义特征,忽视了多层次语义融合对作文评分影响的问题,提出了一种基于多层次语义特征的神经网络(MLSF)模型进行AES。首先,采用卷积神经网络(CNN)捕获局部语义特征,并采用混合神经网络捕获全局语义特征,以从深层次获取作文的语义特征;其次,利用篇章级的作文主题向量来获取主题层特征,同时针对深度学习模型难以挖掘的语法错误和语言丰富程度特征,构造了少量人工特征以从浅层获取作文的语言学特征;最后,通过特征融合对作文进行自动评分。实验结果表明,所提出模型在Kaggle ASAP竞赛公开数据集的所有子集上性能均有显著提升,该模型的平均二次加权的卡帕值(QWK)达到79.17%,验证了该模型在AES任务中的有效性。  相似文献   

6.
丁革建  刘畅 《计算机应用》2022,(S1):386-390
在作文自动评分任务的研究取得了长足发展,教育领域对自动评分任务的需求日益提升的趋势下,通过对现有文献的调研,对作文自动评分技术进行分析与综述。首先,根据技术发展的流程,介绍具有代表性的作文自动评分系统,分析现有模型中采用的评分技术与特征提取技术;其次,从传统技术、深度学习模型、预训练技术以及主题独立环境下的应用四个方面分析作文自动评分任务的关键节点以及相应技术的发展;最后,对值得关注的技术和当前的作文自动评分系统的发展方向进行总结与展望。分析结果表明,不同特征的结合是一种值得关注的研究方向。作文自动评分技术在语法修正及作文润色方面具有较大的应用前景。  相似文献   

7.
随着计算机的普遍应用以及计算机技术的快速发展,计算机辅助性测试和计算机自适应性测试都已先后成为现实。计算机辅助评分,也称作计算机自动评分,就成为人们所希望的下一代计算机辅助工具。中文辅助评分系统的研究尚处于起步阶段,据我们了解还没有一个能大规模使用的系统。我们研究了许多英文的辅助评分系统,并按照文章中的算法提取特征,但是特征的相关度并不高。在该文中,我们利用统计自然语言处理和信息检索的技术提取作文写作水平和作文主题特征。在建模时,融入样本分数分布和一位评分员的评分的信息,创造性的提出三重分段回归模型。实验表明,利用我们的辅助评分系统协助评分,在节省一半阅卷量的情况下,精度可以达到97%以上。  相似文献   

8.
该文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式。基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分。该文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验。实验结果表明,在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍。该表示方法通用性强,没有语种限制,可以扩展到任何语言。  相似文献   

9.
文本聚类在大学英语作文自动评分中应用   总被引:2,自引:0,他引:2       下载免费PDF全文
面向大学英语写作教学的自动作文评分要求评分方法具有针对非特定作文题目的通用性。在作文内容评价方面,文本聚类能够把作文按内容的相似程度聚集到一起,从而形成一棵内密外疏的聚类树。位于聚类树外围的少数与其它作文内容差异较大,即可能跑题的作文可以反馈给教师进行人工判断,从而花费较少的人力即可做出较准确的作文内容评价。实验表明,通过设置合理的相似度阈值,该方法能够有效识别跑题作文。  相似文献   

10.
分析研究当前国内外英语作文自动评分系统的研究成果,提出了一种基于链语法(Link Grammar)的能为学生提供实时训练的英语作文自动评分系统。系统首先通过依据Link Grammar对句子分析后的成本向量(cost vector)计算文章的语法权值,其次则利用文章核心词、非核心词熵值和有效句比例来对文章主题分档,最后则是结合语法权值和主题分档结果计算文章分数。测试结果表明,10~15分段作文达到了88.9%的准确率,说明该系统在10~15分段作文具有较好的适应性,同时系统的分析时间也能很好的满足实时性的要求。  相似文献   

11.
中国英语学习者人数众多,迫切需要针对中国学生特点的、有效适用于大规模英文作文数据的全自动评分算法,以解决中国现有英语教学和大规模英语考试中英文作文批改量大和难度大的瓶颈问题。该文提出了一种能够有效识别中国英语学习者写作特点并能自动识别特征维数的特征选择方法,并在此基础上提出了适用于不平衡分布数据的集成分类评分算法。对来自中国英语学习者语料库中大学英语四、六级不同主题下的1 115篇作文的分类结果显示,该文提出的算法比传统的分类评分算法在类内及类间平均分类准确度、召回率及F度量值上均有较大幅度的提升。  相似文献   

12.
Automatic prosodic break detection and annotation are important for both speech understanding and natural speech synthesis.In this paper,we discuss automatic prosodic break detection and feature analysis.The contributions of the paper are two aspects.One is that we use classifier combination method to detect Mandarin and English prosodic break using acoustic,lexical and syntactic evidence.Our proposed method achieves better performance on both the Mandarin prosodic annotation corpus - Annotated Speech Corpus of Chinese Discourse and the English prosodic annotation corpus - Boston University Radio News Corpus when compared with the baseline system and other researches’ experimental results.The other is the feature analysis for prosodic break detection.The functions of different features,such as duration,pitch,energy,and intensity,are analyzed and compared in Mandarin and English prosodic break detection.Based on the feature analysis,we also verify some linguistic conclusions.  相似文献   

13.
Although English pitch accent detection has been studied extensively, there relatively a few works explore Mandarin stress detection. Moreover, the comparison and analysis between Mandarin stress detection and English pitch accent detection have not been touched for such counterpart tasks. In this paper, we discuss Mandarin stress detection and compare it with English pitch accent detection. The contributions of the paper are two aspects: one is that we use classifier combination method to detect Mandarin stress and English pitch accent by using acoustic, lexical and syntactic evidence. Our proposed method achieves better performance on both the Mandarin prosodic annotation corpus—ASCCD and the English prosodic annotation corpus—Boston University Radio News Corpus (BURNC) when compared with the baseline system. We also verify our proposed method on other prosodic annotation corpus and continuous speech corpus. The other is the feature analysis. Duration, pitch, energy and intensity features are compared for Mandarin stress detection and English pitch accent detection. Based on the analysis of prosodic annotation corpora, we also verify some linguistic conclusions.  相似文献   

14.
首次实现了一个基于依存关系的中文名词性谓词识别平台,作为语义角色标注的前提,谓词识别的结果直接影响语义角色标注的性能。使用两种方法进行实验:一种是基于传统的特征向量的方法在Chinese Nombank 的转换语料上进行了系统实验,对各种词法特征、结构特征及其组合进行了测试,标准语料上F1值达到89.65,自动语料上达到81.27。另一种是使用树核的方法进行探索性实验,在标准语料和自动语料上分别得到84.62和80.93的F1值。  相似文献   

15.
针对目前国内的英语作文辅助批阅系统缺少准确而高效的跑题检测算法的问题,提出了一种结合LDA和Word2vec的跑题检测算法。该算法利用LDA模型对文档建模并通过Word2vec对文档训练,利用得到的文档主题和词语之间的语义关系,对文档中各主题及其特征词计算概率加权和,最终通过设定合理阈值筛选出跑题作文。实验中通过改变文档的主题数而得到的不同F值,确定了最佳主题数。实验结果表明所提出的方法比基于向量空间模型的方法更具有效性,可以检测到更多的跑题作文并且准确率较高,F值达到89%以上,实现了作文跑题检测的智能化处理,可以有效地应用在英语作文教学中。  相似文献   

16.
High-quality night-time imaging is crucial to video surveillance, automatic drive and consumer electronics. However, different from day-time imaging, night-time imaging suffers from some disadvantages, such as low light, uneven illumination, difficult focusing, etc., which raises a great concern to the night-time imaging quality. Accordingly, a practical night-time image quality evaluation method is very promising to control and improve the night-time imaging system. Toward this end, in this paper, we propose a blind image quality assessment (BIQA) method to quantify the night-time image quality. Specifically, in the proposed method, we measure the night-time image quality by investigating the fundamental image properties, which are highly relevant to the image quality, such as the brightness, saturation, sharpness, noiseness, contrast and the semantics. Specific features are designed to characterize the image properties properly. Then we employ the support vector regression (SVR) method to infer the image quality with the extracted quality-aware features. The proposed BIQA method for night-time images is thoroughly evaluated on a representative night-time image database. Experimental results demonstrate that the proposed BIQA method for night-time images achieves superior prediction performance to other state-of-the-art BIQA methods.  相似文献   

17.
基于并行深度卷积神经网络的图像美感分类   总被引:1,自引:0,他引:1  
随着计算机和社交网络的飞速发展, 图像美感的自动评价产生了越来越大的需求并受到了广泛关注. 由于图像美感评价的主观性和复杂性, 传统的手工特征和局部特征方法难以全面表征图像的美感特点, 并准确量化或建模. 本文提出一种并行深度卷积神经网络的图像美感分类方法, 从同一图像的不同角度出发, 利用深度学习网络自动完成特征学习, 得到更为全面的图像美感特征描述; 然后利用支持向量机训练特征并建立分类器, 实现图像美感分类. 通过在两个主流的图像美感数据库上的实验显示, 本文方法与目前已有的其他算法对比, 获得了更好的分类准确率.  相似文献   

18.

There is a great demand of automatic face recognition in the society. The methods of face recognition are performed satisfactorily in controlled environment. The challenging benchmarks demonstrate that these methods may not adequately work in unconstrained environment. In this paper, we develop a novel framework of face recognition system that outperforms in unconstrained environment. The framework works on features based method that extracts facial landmarks from images. After quality check the patch experts are generated and used to model the appearance of landmarks of interests. The effect of discriminatory features is further enhanced by assigning weights to them that are to be set to the ratio of the interclass variance to the intraclass variance. The result shows that the proposed framework achieves better recognition accuracy in comparison to other known methods on publically available challenging datasets.

  相似文献   

19.
该文提出了一种结合依存句法分析和深度神经网络的自动句子填空技术。首先,提出了一种依存句法信息展开的序列建模方案,可以在引入句法信息的同时兼顾效率,并在此基础上利用排序学习思想,训练候选答案排序模型;其次,针对整体序列建模的细节建模失准问题,提出了一种基于语言模型多状态信息融合的自动句子填空模型;最后,设计了一种结合序列表示、依存句法信息、多状态信息的多源信息融合模型。该文还构建出一个英文答题数据集并据此进行了实验。实验结果表明,依存句法展开模型相对于常用的序列建模方案,准确率有11%的绝对提升;语言模型状态排序模型相对于基线模型,准确率有9.3%的绝对提升;最终的多源信息融合模型,在测试集上获得最高76.9%的准确率。  相似文献   

20.
The application of cross‐corpus for speech emotion recognition (SER) via domain adaptation methods have gain high acknowledgment for developing good robust emotion recognition systems using different corpora or datasets. However, the issue of cross‐lingual still remains a challenge in SER and needs more attention to resolve the scenario of applying different language types in both training and testing. In this paper, we propose a triple attentive asymmetric convolutional neural network to address the recognition of emotions for cross‐lingual and cross‐corpus speech in an unsupervised approach. The proposed method adopts the joint supervision of softmax loss and center loss to learn high power discriminative feature representations for target domain via the use of high quality pseudo‐labels. The proposed model uses three attentive convolutional neural networks asymmetrically, where two of the networks are used to artificially label unlabeled target samples as a result of their predictions from training on source labeled samples and the other network is used to obtain salient target discriminative features from the pseudo‐labeled target samples. We evaluate our proposed method on three different language types (i.e., English, German, and Italian) data sets. The experimental results indicate that, our proposed method achieves higher prediction accuracy over other state‐of‐the‐art methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号