共查询到20条相似文献,搜索用时 109 毫秒
1.
在使用词嵌入法进行词转向量时,两个反义词会转换成相近的向量。如果这两个词是情感词,将会导致词的情感信息的丢失,这在情感分析任务中是不合理的。为了解决这个问题,提出了一种在词嵌入的基础上增加情感向量来获取情感信息的方法。首先利用情感词典资源构建情感向量,将其与词嵌入法得到的词向量融合在一起;然后采用双向长短期记忆(BiLSTM)网络获取文本的特征;最后对文本的情感进行分类。在4个数据集上分别对该方法与未融合情感向量的方法进行了实验。实验结果表明所提方法分类准确度与F1值都高于未融合方法,说明了加入情感向量有助于提高情感分析的性能。 相似文献
2.
3.
文本情感是信息挖掘的一个新兴领域,近年受到管理学等相关领域的广泛关注。目前,文本情感分析使用的方法主要有情感词典方法和机器学习方法。由于文本情感分析的结果对优化政府、企业以及消费者决策具有重大意义,以文本情感分析的方法为视角,对情感词典的方法、有监督的机器学习方法和弱监督的深度学习方法以及其他方法的相关文献进行了梳理并做出评述。此外,指出虽然文本情感分析领域的学者基于情感词典和有监督的机器学习方法已提出许多情感分析模型,但准确率和效率普遍不高,进一步的研究重点应在于使用深度学习的方法处理文本情感,并提出未来的研究方向。 相似文献
5.
文本情感分析是自然语言处理领域的一个重要分支,广泛应用于舆情分析和内容推荐等方面,是近年来的研究热点.根据使用的不同方法,将其划分为基于情感词典的情感分析方法、基于传统机器学习的情感分析方法、基于深度学习的情感分析方法.通过对这三种方法进行对比,分析其研究成果,并对不同方法的优缺点进行归纳总结,介绍相关数据集和评价指标... 相似文献
6.
朱俭 《计算机工程与应用》2014,50(8):211-214
文本情感分类是指通过挖掘和分析文本中的观点、意见和看法等主观信息,对文本的情感倾向做出类别判断。基于集成情感成员模型提出一种文本情感分析方法。把基于改进的神经网络、基于语义特征和基于条件随机场的三个情感分类模型作为成员模型集成在一起。集成后的模型能够涵盖不同的情感特征,从而克服了传统集成学习中仅关注成员模型处理结果的不足。以公开语料进行实验,集成模型融合了多个成员模型的优势,分类正确率达到了88.2%,远高于任一成员模型的效果。 相似文献
7.
情感分析是指通过提取文本特征对基于文本的情感倾向进行分类,是自然语言处理领域中的一项重要任务。为了提高文本情感分析的性能,该文将分类任务定义为一个比较问题,并提出了基于比较学习(Comparing to Learn, C2L)的分类模型。C2L的目标是通过与已标注的样本进行比较来对句子进行评分,实际上,通过比较方法进行分类比训练一个过于复杂的模型更加有效。在两个常用数据集上的实验结果表明,C2L的性能优于现有的许多模型;通过调整C2L的内部结构,可以在不同的任务和数据集上取得好的表现。 相似文献
8.
9.
为了进一步了解情感分析方向的发展趋势,通过对基于机器学习的情感分析文献的整理与分析,首先对国内外基于机器学习的情感分析方法进行了梳理,介绍了相关方法的基本原理及算法改进;其次列举了几种方法在电子商务、餐馆评价和灾害管理中的实际应用,对当前情感分析应用中存在的主要困难进行探讨,对相关方法处理能力进行评价;最后得出了上下游... 相似文献
10.
11.
Sundas Rukhsar Mazhar Javed Awan Usman Naseem Dilovan Asaad Zebari Mazin Abed Mohammed Marwan Ali Albahar Mohammed Thanoon Amena Mahmoud 《计算机系统科学与工程》2023,47(1):791-807
Web-blogging sites such as Twitter and Facebook are heavily influenced by emotions, sentiments, and data in the modern era. Twitter, a widely used microblogging site where individuals share their thoughts in the form of tweets, has become a major source for sentiment analysis. In recent years, there has been a significant increase in demand for sentiment analysis to identify and classify opinions or expressions in text or tweets. Opinions or expressions of people about a particular topic, situation, person, or product can be identified from sentences and divided into three categories: positive for good, negative for bad, and neutral for mixed or confusing opinions. The process of analyzing changes in sentiment and the combination of these categories is known as “sentiment analysis.” In this study, sentiment analysis was performed on a dataset of 90,000 tweets using both deep learning and machine learning methods. The deep learning-based model long-short-term memory (LSTM) performed better than machine learning approaches. Long short-term memory achieved 87% accuracy, and the support vector machine (SVM) classifier achieved slightly worse results than LSTM at 86%. The study also tested binary classes of positive and negative, where LSTM and SVM both achieved 90% accuracy. 相似文献
12.
目前关于情感倾向性的研究均以语言内容为主要对象,然而民族的思维模式影响了语言的表达形式。通过对汉民族"图形式"、"具体性"、"散点视"的思维特点和西方民族"直线式"、"抽象性"、"聚点视"的思维特点进行对比研究,提出了基于中西思维模式的情感倾向性分析方法。针对"图形式"和"直线式"思维特点,给出了位置相关的量化方法;针对"具体性"和"抽象性"思维特点给出了基于词性和语法特征的分析方法;针对"散点视"和"聚点视"思维特点提出了基于视窗的分析方法。实验结果表明,在中英文语料中考虑各自的思维模式特点有助于提高情感倾向性识别的效果。 相似文献
13.
A gap among the people has been created due to a lack of social interactions. The physical void has led to an increase in online interaction among users on social media platforms. Sentiment analysis of such interactions can help us analyze the general public psychology during the pandemic. However, the lack of data in non-English and low-resource languages like ‘Hindi’ makes it difficult to study it among native and non-English speaking masses. Here, we create a small collection of ‘Hindi’ tweets on COVID-19 during the pandemic containing 10,011 tweets for sentiment analysis, which is named as sentiment analysis for Hindi (SAFH). In this article, we describe the process of collecting, creating, annotating the corpus, and sentiment classification. The claims have been verified using different word embedding with a deep learning classifier through the proposed model. The achieved accuracy of the proposed model yields up to a permissible rate of 90.9%. 相似文献
14.
Mamoona Humayun Danish Javed Nz Jhanjhi Maram Fahaad Almufareh Saleh Naif Almuayqil 《计算机系统科学与工程》2023,47(1):575-591
Twitter has emerged as a platform that produces new data every day through its users which can be utilized for various purposes. People express their unique ideas and views on multiple topics thus providing vast knowledge. Sentiment analysis is critical from the corporate and political perspectives as it can impact decision-making. Since the proliferation of COVID-19, it has become an important challenge to detect the sentiment of COVID-19-related tweets so that people’s opinions can be tracked. The purpose of this research is to detect the sentiment of people regarding this problem with limited data as it can be challenging considering the various textual characteristics that must be analyzed. Hence, this research presents a deep learning-based model that utilizes the positives of random minority oversampling combined with class label analysis to achieve the best results for sentiment analysis. This research specifically focuses on utilizing class label analysis to deal with the multiclass problem by combining the class labels with a similar overall sentiment. This can be particularly helpful when dealing with smaller datasets. Furthermore, our proposed model integrates various preprocessing steps with random minority oversampling and various deep learning algorithms including standard deep learning and bi-directional deep learning algorithms. This research explores several algorithms and their impact on sentiment analysis tasks and concludes that bidirectional neural networks do not provide any advantage over standard neural networks as standard Neural Networks provide slightly better results than their bidirectional counterparts. The experimental results validate that our model offers excellent results with a validation accuracy of 92.5% and an F1 measure of 0.92. 相似文献
15.
World Wide Web - The outbreak of the novel coronavirus disease (COVID-19) has been ongoing for almost two years and has had an unprecedented impact on the daily lives of people around the world.... 相似文献
16.
社交网络作为社会生活不可或缺的一部分,针对其产生的文本数据进行情感分析已成为自然语言处理领域的一个研究热点。鉴于深度学习技术能够自动构建文本特征,人们已提出CNN(convolutional neural network)、BLSTM(bidirectional long short-term memory)等模型来解决文本情感分析问题,但还存在结构较为复杂或训练时间较长等问题,而BGRU(bidirectional gated recurrent unit)能记忆序列的上下文信息,并且结构较为简单,训练速度较快。提出一种基于BGRU的中文文本情感分析方法,首先将文本转换为词向量序列,然后利用BGRU获得文本的上下文情感特征,最后由分类器给出文本的情感倾向。在ChnSentiCorp语料上进行实验,该方法取得了90.61%的F1值,效果优于CNN和BLSTM等模型,并且训练速度是BLSTM的1.36倍。 相似文献
17.
中文文本情感词典构建方法 总被引:1,自引:0,他引:1
互联网海量文本的情感分析是当前的一个研究热点。介绍了一种中文文本情感词典构建方法,该方法选用若干个情感种子词,利用搜索引擎返回的共现数,通过改进的PMI(pointwise mutual information)算法计算情感词的情感权值。将构建的情感词典应用到文本情感分类实验中,在不同的语料环境下,对比基于情感词典和朴素贝叶斯分类器下的文本情感分类效果,实验结果表明,构建的情感词典,可有效用于情感特征选择和直接用于情感分类,并且分类性能稳定。 相似文献
18.
介绍了指数平滑法和Croston法,分析了指数平滑法和两步法的工作原理,结合备件需求预测问题,通过对指数平滑法和两步法方差的分析,得到两步法比指数平滑法具有更好的鲁棒性。为进一步研究两步法提供一定的理论基础。 相似文献
19.
基于Stacking组合分类方法的中文情感分类研究 总被引:3,自引:1,他引:2
情感文本分类(简称情感分类)是一种面向主观信息分类的文本分类任务。目前,由于其广泛的应用前景,该任务在自然语言处理研究领域中得到了普遍关注,相继出现多种用于情感文本分类的有监督的分类方法。该文具体研究四种不同的分类方法在中文情感分类上的应用,并且采用一种基于Stacking的组合分类方法,用以组合不同的分类方法。实验结果表明,该组合方法在所有领域都能够获得比最好基分类方法更好的分类效果。从而克服了分类方法领域依赖的困境(不同领域需要选择不同基分类方法才能获得更好的分类结果)。 相似文献
20.
情感分析作为文本挖掘的一个新型领域,可用于分类、归纳用户发布的产品评论,从而有助于商家改善服务,提高产品质量;同时为其他消费者提供购买决策。本文提出一种基于情感词抽取与LDA特征表示的情感分析方法,对产品评论进行褒贬二元分类。在情感词抽取中,采用人工构造的情感词典对预处理之后的文本抽取情感词;用LDA模型建立文档的主题分布,以评论-主题分布作为特征,用SVM分类器进行分类。实验结果表明,本文方法在评论褒贬分类方面有着良好的效果。 相似文献