首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
目前的情感分析研究大部分仅局限于能够明显地表达意见的主观性文本,却没有对一些隐含地表达情感的文本进行分析.针对这一不足,提出一种基于条件随机场(CRFs)模型的意见挖掘中维吾尔语文本隐式情感分析方法.利用互信息(MI)衡量上下文的依赖度,结合词法、语境依赖词、标点符号和习语等特征用于隐式情感分析.在特征选择时,通过对信息增益(IG)进行改进,解决语料中数据集不平衡的问题.该方法用于维吾尔语文本隐式情感分析的准确率为77.11%,召回率为78.37%,表明了其在意见挖掘中隐式情感分析任务上的有效性.  相似文献   

2.
情感细粒度分析是情感分析的分支,随着社交网络规模的扩大,简单的划分积极或消极的粗粒度情感分析不能满足实际应用的需要,基于评价对象及其属性的细粒度情感分析得到了重视.近几年深度学习在自然语言处理领域的成功应用给情感细粒度分析提供了新的思路.以NLPCC2013任务二微博数据集为研究对象,探究微博短文本在不同神经网络结构中的情感细粒度分类结果并加入词向量进行优化,最后分析与总结了神经网络微博短文本细粒度情感分析的影响因素及发展方向.  相似文献   

3.
针对中文语句的细粒度情感倾向分析问题,构建一个细粒度情感词库。对所含词语进行权重值的计算,并结合中文语句的句式、情感词修饰方法等特点,提出一种基于词库权重、句式权重、修饰权重相结合的语句级细粒度情感倾向性分析算法。实验结果表明,该算法可以准确计算出评论语句的情感倾向值,为进一步研究语句级细粒度情感倾向分类提供了重要的参考依据。  相似文献   

4.
细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示并将其加入序列标注模型的输入部分。首先构建一份新的电商领域情感词典,然后在电商评论文本真实数据上,分别为条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)这两种常用序列标注模型设计基于领域情感词典的特征表示。实验结果表明,基于电商领域情感词典的特征表示方法在两种模型上都取得了良好的效果,并且超过其他情感词典。  相似文献   

5.
主题抽取是意见挖掘的核心任务之一。该文面向维吾尔语评论文本, 针对显式主题和隐式主题, 提出了一种陈述级的主题抽取方法。该方法采用GLR-Cascaded LDA模型抽取段落级的局部主题、篇章级的全局主题, 建立全局—局部主题关系, 并将这些关系对应到每个意见陈述中; 然后运用Bootstrapping和模式匹配的方法进行显式陈述的主题抽取; 最后使用隐式主题推断算法推断隐式陈述的主题。主题抽取的最终目标是为每个意见陈述建立意见陈述—主题四元组。实验结果证明了该方法在主题抽取任务中的有效性。  相似文献   

6.
传统文本情感分析,通常从文本(可以是文档、段落或句子)整体出发,只能给出一整句话的情感值,无法准确表达用户对不同目标(情感附着物)的情感倾向.因此,本文以深度学习算法为基础进行细粒度情感分析研究.通过分析注意力编码网络的结构和算法原理,提出相应的情感分析框架,以及文本预处理和文本表示方法.该模型在公开数据集SemEval 2014上进行了实验,结果显示基于注意力编码网络的情感分析模型可以获得更高的准确率.  相似文献   

7.
范东旭  过弋 《计算机科学》2023,(12):246-254
基于方面的多模态情感分析任务(Multimodal Aspect-Based Sentiment Analysis, MABSA),旨在根据文本和图像信息识别出文本中某特定方面词的情感极性。然而,目前主流的模型并没有充分利用不同模态之间的细粒度语义对齐,而是采用整个图像的视觉特征与文本中的每一个单词进行信息融合,忽略了图像视觉区域和方面词之间的强对应关系,这将导致图片中的噪声信息也被融合进最终的多模态表征中,因此提出了一个可信细粒度对齐模型TFGA(MABSA Based on Trusted Fine-grained Alignment)。具体来说,使用FasterRCNN捕获到图像中包含的视觉目标后,分别计算其与方面词之间的相关性,为了避免视觉区域与方面词的局部语义相似性在图像文本的全局角度不一致的情况,使用置信度对局部语义相似性进行加权约束,过滤掉不可靠的匹配对,使得模型重点关注图片中与方面词相关性最高且最可信的视觉局域信息,降低图片中多余噪声信息的影响;接着提出细粒度特征融合机制,将聚焦到的视觉信息与文本信息进行充分融合,以得到最终的情感分类结果。在Twitter数据集上进行实...  相似文献   

8.
酒店在线评论细粒度挖掘具有重要研究意义.以酒店在线评论具体特征属性和情感分类为研究目标,应用Apfiori算法和情感词典匹配算法,对重庆雾都宾馆在线评论数据深入挖掘,挖掘出用户最关注的酒店十大特征和满意度结果,进一步挖掘出商务出差等五种不同出游类型人最关注的酒店五大特征和满意度结果.这种方法不仅能对酒店领域评论进行分析,同样能够应用于其他领域.  相似文献   

9.
该文主要是针对维吾尔语中生气,高兴,难过及惊讶等四大类情感分别进行基于情感词词典的句子情感分类。首先,结合维吾尔句子中的情感特点,通过人工抽取的方法收集了维吾尔句子中能表达情感的关键词和情感短语,并建立了包含情感关键词和情感短语的情感词词典。然后,利用关键词匹配算法实现了具有分类速度快、分类正确率较高的维吾尔语句子情感分类应用系统。最后,给出了实验结果,并且分析了所存在的问题及提出了相应的解决策略。  相似文献   

10.
该文主要是针对维吾尔语中生气,高兴,难过及惊讶等四大类情感分别进行基于情感词词典的句子情感分类。首先,结合维吾尔句子中的情感特点,通过人工抽取的方法收集了维吾尔句子中能表达情感的关键词和情感短语,并建立了包含情感关键词和情感短语的情感词词典。然后,利用关键词匹配算法实现了具有分类速度快、分类正确率较高的维吾尔语句子情感分类应用系统。最后,给出了实验结果,并且分析了所存在的问题及提出了相应的解决策略。  相似文献   

11.
随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要。该文考虑到维吾尔文没有足够的情感训练语料和完整的情感词典,结合机器学习方法和词典方法的优点,构建一个分类器模型 LCUSCM(Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model),先用自己构建的维吾尔文情感词典对语料进行高质量的情感分类,分类过程中对词典进行递归扩充,再根据每条句子的情感得分,从词典分类的结果中选择一部分语料来训练一个分类器并改进第一步的分类结果。此方法的正确率比单独使用机器学习方法提高了9.13%, 比词典方法提高了1.82%。  相似文献   

12.
现有的维吾尔文文本情感分类方法以从空格分词中得到的unigram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象。该文从维吾尔文词汇之间的顺序依赖关系入手,总结若干个词性组合规则,提取能够表达丰富情感信息的Bi-tagged特征,并基于支持向量机(SVM)分类器对维吾尔文情感语料库进行了正负情感分类。实验结果表明,在维吾尔文文本情感分类中: (1)当包含该文提出的各项词性规则时,Bi-tagged特征的性能最优;(2)Bi-tagged特征不仅能够提取情感丰富的信息,而且可以提取否定信息;(3)与常用的unigram、bigram特征以及unigram和bigram的组合特征在该文数据集上的分类效果相比,该文所提取的Bi-tagged与unigram的组合特征分类效果更佳,比该文的Baseline的分类准确率提高了4.225%。该研究成果不但可以进一步提高维吾尔文文本情感分类效率,也可为哈萨克语、柯尔克孜语等亲属语言的情感分类提供借鉴。  相似文献   

13.
该文定义了一种用于细粒度意见挖掘的情感本体树结构,并基于细粒度意见要素抽取技术提出本体树的自动构建方法。重点研究了评价搭配抽取算法、搭配倾向预测算法以及特征聚合算法,并在解决搭配倾向预测及特征聚合问题时引入了互联网资源的自然标注性。在COAE2011实验3评测数据集上的实验结果证明了该算法在评价搭配抽取、搭配倾向预测上都取得了很好的效果。  相似文献   

14.
在研究区分性关键词提取方法的基础上,对维吾尔语中的生气和高兴等常见情感类型进行基于文本句子的情感分类研究。结合维吾尔文本句子中的情感表达特点,以词频和文档频率作为基本统计量,通过计算同一词语在不同组合统计量下的类间差异得到区分性关键词,并基于这些关键词进行特征提取和区分性情感模型构建。从维吾尔语电影字幕、小说等文本库中提取生气和高兴2种情感构造实验数据集,并验证所提出的情感分类方法。实验结果表明,基于区分性关键词的建模方法能有效地对维吾尔文本句子进行情感分类。  相似文献   

15.
贾川  方睿  浦东  康刚 《中文信息学报》2019,33(9):123-128
目前,深度神经网络模型已经在文本情感分析领域取得了较好的效果,但是对于属性相关的细粒度的情感分析任务,现有研究方法的效果仍有待改进。该文提出了一种基于循环实体网络来进行细粒度情感分析的方法,在网络中嵌入预定义的评价属性类别信息,利用扩大的内部记忆链来抽取与每个属性类别相关的情感特征,并通过动态记忆单元控制与属性相关情感信息的远距离依赖,然后,对于给定的单个属性类别,利用注意力机制从内部记忆链中抽取该属性类别的情感特征进行分类。该文提出的方法在Sentihood数据上与目前精度最高的方法相比,取得了近1个百分点的提升,而且模型的收敛速度更快。  相似文献   

16.
产品评论文本是情感分析的重要研究对象,目前已有的产品评论语料库大都较为粗疏,没有完整地标注出对象、属性、极性“三要素”,影响自动分析的应用场景。对此,该文构建了细颗粒度评论语料库,共包含9 343句汽车评论短文本,不仅人工标注了“三要素”的具体词语,而且将其对应到产品和属性的知识本体树上。此外,对无情感词的隐含表达、特殊文本(如建议文本、比较句等)也标注出对应的三元组并予以特殊标签。语料统计表明,对象和属性要素的共现率高达77.54%,验证了构建“三要素”齐全标注体系的必要性;基于该语料库的“三要素”自动标注实验F1值可达70.82%,验证了细颗粒度标注体系的可计算性以及语料库构建的规范性和应用价值。该语料库可以为细颗粒度情感分析研究提供基础数据。  相似文献   

17.
提出基于自动标注的维吾尔语情感词分析句子情感的方法。将8种情感类别作为情感类别集合。判断句子中是否含有转折性连词,若有则屏蔽含有转折性连词句子的前半部分,通过条件随机场模型自动标注句子中的情感词,依据标注的情感词,为句子的每种情感类别打分,得分最高的情感类型作为句子的候选情感。识别句中维语的否定成分,根据否定成分出现的奇偶次数对句子的候选情感修正,得到句子的最终情感类型。实验结果表明,在句子情感分析上该方法可取得较好的效果。  相似文献   

18.
目前基于词嵌入的卷积神经网络文本分类方法已经在情感分析研究中取得了很好的效果。此类方法主要使用基于上下文的词嵌入特征,但在词嵌入过程中通常并未考虑词语本身的情感极性,同时此类方法往往缺乏对大量人工构建情感词典等资源的有效利用。针对这些问题,该文提出了一种结合情感词典和卷积神经网络的情感分类方法,利用情感词典中的词条对文本中的词语进行抽象表示,在此基础上利用卷积神经网络提取抽象词语的序列特征,并用于情感极性分类。该文提出的相关方法在中文倾向性分析评测COAE2014数据集上取得了比目前主流的卷积神经网络以及朴素贝叶斯支持向量机更好的性能。  相似文献   

19.
基于层叠CRFs模型的句子褒贬度分析研究   总被引:1,自引:1,他引:1  
刘康  赵军 《中文信息学报》2008,22(1):123-128
本文研究句子的褒贬度分析问题。针对传统的基于分类的句子褒贬度分析方法不能考虑上下文信息的问题,以及基于单层模型的句子褒贬度分类方法中的由于标记冗余引起的分类精度不高问题,本文提出了基于层叠式CRFs模型的句子褒贬度分析方法。该方法利用多个CRFs模型从粗到细分步地判断句子的褒贬类别及其褒贬强度,其中层叠式框架可以考虑句子褒贬类别与褒贬强度类别之间的层级冗余关系,而CRFs模型可以利用上下文信息对于句子褒贬类别和强度的影响。该方法在有效识别句子褒贬度的同时,提高了句子褒贬强度判别的准确度。实验证明相对于传统分类方法和单层CRFs模型,本文的方法取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号