首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 197 毫秒
1.
改进的基于知网词汇语义褒贬倾向性计算   总被引:1,自引:0,他引:1       下载免费PDF全文
词汇语义褒贬倾向性研究是句子褒贬倾向性识别的基础,而句子褒贬倾向性识别又是文本倾向性识别和篇章结构褒贬倾向性识别的基础。以《知网》的词汇语义相似度计算为基础,针对目前采用计算基准词对与词汇相似度的方法识别词汇褒贬倾向性理论,从褒贬基准词和计算公式入手,提出了改进办法。实验证明,在同样基准词对下,准确率得到了很大的提高,达到98.94%,具有实际应用价值。  相似文献   

2.
基于HowNet的句子褒贬倾向性研究   总被引:4,自引:2,他引:2       下载免费PDF全文
文本倾向性识别在信息过滤、自动文摘、文本分类等领域有广泛的应用前景。句子倾向性研究是文本倾向性识别的基础,结合句法分析结果和词语语义倾向性可以衡量句子褒贬倾向性。以HowNet的词汇语义相似度计算为基础,提出了基于的语义距离和语法距离的句子褒贬倾向性计算方法。大量语句实验表明,该方法的计算结果与人工判别结果更接近。  相似文献   

3.
该文设计了一种面向信息内容安全的不良文本信息过滤模型。该模型采用主题信息过滤和倾向性过滤两级过滤模式,以语句为基本处理单元,采用依存句法获取语句的语义框架,结合基于知网的词汇褒贬倾向性判别,识别文本中的不良信息并予以过滤。实验表明,该模型能够较好地提高文本过滤效率和准确率。  相似文献   

4.
中文网络评论观点词汇语义褒贬倾向性判断   总被引:1,自引:0,他引:1  
李华  储荷兰  高旻 《计算机应用》2012,32(11):3023-3033
由于网络评论信息的庞大,因此通过计算机自动识别出用户评论观点的褒贬倾向性具有重要意义。以基于HowNet的词汇语义相似度方法的词汇语义倾向性分析为基础,根据观点词的褒贬特性改进词汇语义相似度计算方法以适用于评论词汇的倾向性判断,并且考虑词汇与多个基准词相似度较小时弱化个别有价值的较大相似度,从而提高倾向性判断的准确率。实验结果表明,改进后的方法在计算观点词词汇语义相似度时更为合理,并且判断倾向性时准确率有一定的提高。  相似文献   

5.
吴晨  韦向峰 《计算机科学》2016,43(Z6):435-439
在互联网上用户评价内容中很多比较句的比较结果反映了语句陈述者对比较对象的倾向性态度。根据已有的10类比较句句型总结了它们的常见概念搭配,在基于语义块的语句倾向性分析方法的基础上构建了比较句自动识别系统和比较句倾向性自动分析系统。采用第四届中文倾向性分析评测的语料进行实验,对语料中的比较句进行了识别,对比较句中的要素进行了抽取并且分析了比较句的倾向性,识别结果和倾向性分析结果均好于所有参评系统的平均值。  相似文献   

6.
语义不确定的词和句子在中文情感分析中有着重要意义.语义不确定的词一般是一个语义十分丰富的词,在表达中隐含着某种倾向性的评价;而语义不确定的句子一般表现为褒贬情感词相当,极性倾向不明显.以不确定词“好”为例对不确定句子进行特征设计,然后通过4种监督学习的分类方法对比实验说明支持向量机在处理不确定词和不确定句子的情感分析上有较好的效果.  相似文献   

7.
褒贬倾向性识别在信息过滤、自动文摘、文本分类等领域有良好的应用前景.针对褒贬倾向性较为集中的论坛网页,提出了基于特定论坛主题的网页文本褒贬倾向性计算方法.结合句法分析和词语相似度计算方法,提取反映主题倾向的特征词,根据每个信息块的倾向性计算页面的褒贬倾向,实现了论坛网页句子级别、信息块级别和网页级别等三个层次的褒贬倾向性计算,在部分语料范围内的实验结果良好,对于此类网页的分析评价有一定的意义.  相似文献   

8.
以网络评论为研究对象,试图把隐马尔科夫模型从已经成功应用的模式识别领域推广到语义倾向性分析系统.与传统倾向性识别系统不同的是,此理论通过建立隐马尔科夫分类模型,将未知文本进行状态序列化,得到文本中所有的词语所对应的倾向性,然后选定多数词的倾向性来作为文本的总体语义倾向.实验表明,当训练数据越全面、规模越大时,识别率越高.  相似文献   

9.
基于语义分析的词汇倾向识别研究   总被引:2,自引:0,他引:2  
随着互联网的安全发展和人们对信息需求的日益增强,文本倾向识别方向的研究在许多领域有着广阔的发展前景.作为文本语义倾向识别的研究基础,本文侧重于词汇的语义倾向性判别,利用《知网》中对汉语词汇的定义和描述,建立由褒贬倾向较强烈的词汇组成的种子集,并结合上下文环境因素的影响,采用一种度量方法获取种子词与普通词之间的语义倾向相似度,识别普通词的褒贬倾向.实验表明,本文方法对常用词的倾向识别效果较好,可为更大粒度的文本倾向识别打好基础,具有一定的实用价值.  相似文献   

10.
在文本的向量空间表示模型下,针对文本褒贬倾向判别问题,提出了一种基于潜在语义分析的特征权重计算方法。除词频信息外,该方法考虑了潜在语义分析所提供的同义词、近义词信息对特征权重的影响。采用基于Fisher判别准则的特征选择方法,以支持向量机作为分类器,在2 739篇语料(2008年中文倾向性分析评测)上进行了实验。实验结果表明,提出的特征权重计算方法对文本褒贬倾向判别是有效的。  相似文献   

11.
研究中文微博情感分析中的观点句识别及要素抽取问题。在观点句识别方面,提出了一种利用微博中的情感词和 情感影响因子计算微博语义情感倾向的新算法;在观点句要素抽取方面,利用主题词分类及关联规则,辅以一系列剪枝、筛选和定界规则抽取评价对象。通过观点句识别和观点句要素抽取结果的相互过滤,进一步提高召回率。实验数据采用第六届中文倾向性分析评测所发布的数据,结果表明,本文方法在观点句识别和要素抽取方面能够取得较好的效果,观点句识别的精确率、召回率入F值分别为95.62%,54.10%及69.10%;观点句要素抽取的精确率、召回率以及F值分别为22.07%,12.66%和16.09%。  相似文献   

12.
随着网络购物的发展,Web上产生了大量的商品评论文本数据,其中蕴含着丰富的评价知识。如何从这些海量评论文本中有效提取商品特征和情感词,进而获取特征级别的情感倾向,是进行商品评论细粒度情感分析的关键。本文根据中文商品评论文本的特点,从句法分析、词义理解和语境相关等多角度获取词语间的语义关系,然后将其作为约束知识嵌入到主题模型,提出语义关系约束的主题模型SRC-LDA(semantic relation constrained LDA),用来实现语义指导下LDA的细粒度主题词提取。由于SRC-LDA改善了标准LDA对于主题词的语义理解和识别能力,从而提高了相同主题下主题词分配的关联度和不同主题下主题词分配的区分度,可以更多地发现细粒度特征词、情感词及其之间的语义关联性。通过实验表明,SRC-LDA对于细粒度特征和情感词的发现和提取具有较好的效果。  相似文献   

13.
倾向性句子识别是文本倾向性分析的重要组成部分,其目的是识别文档中具有情感倾向的主观性句子。中文句子的倾向性不仅与倾向词有关,而且还跟句法、语义等因素有关,这使得倾向性句子识别不能简单地从词语的倾向性来统计得到。该文提出了一种基于N-gram超核的中文倾向性句子识别分类算法。该算法基于句子的句法、语义等特征构造N-gram超核函数,并采用基于该超核函数的支持向量机分类器识别中文倾向性句子。实验结果表明,与多项式核、N-gram核等单核函数相比,基于N-gram超核的中文倾向性句子识别算法在一定程度上能有效识别倾向性句子。  相似文献   

14.
方面级别的情感分析(ABSA)旨在确定句子中特定目标的情感倾向。大部分现有方法仅使用语义层面信息,不能很好地利用不同方面词的意见术语来达到精确的情感分类,且模型不具有可解释性。语法层面信息中词性信息和以特定方面术语为根节点的句法结构依存树可以用于捕获句子中特定方面的意见术语。提出了结合词性信息且具有模型可解释性的BG-CNN,并引入依存树作为辅助信息用于细粒度文本情感分析。提出了增强损失函数用于模型的训练。在三个经典数据集上进行验证,实验结果表明了该模型和增强损失函数的有效性。  相似文献   

15.
微博日益成为一个巨大而复杂的互联网舆论平台。分析微博中特定话题的情感趋势对于了解网络舆情、分析产品销量趋势显得尤为重要。该文使用微博进行真实事件公众情感趋势预测: 首先,考虑到微博特征稀疏、上下文缺失的特性,借助词语上下位语义关系对其进行语义扩充;其次,使用语义特征和情感常识知识构造双层分类方法进行情感分析;最后,对特定事件在连续时间段内的微博使用时序情感分析方法进行公众情感趋势预测。实验证明,该情感分析方法准确率相对于传统分类方法有明显的提高,在此基础上的情感趋势预测符合事件的真实发展状况。  相似文献   

16.
With the growing availability and popularity of online reviews, consumers' opinions towards certain products or services are generated and spread over the Internet; sentiment analysis thus arises in response to the requirement of opinion seekers. Most prior studies are concerned with statistics-based methods for sentiment classification. These methods, however, suffer from weak comprehension of text-based messages at semantic level, thus resulting in low accuracy. We propose an ontology-based opinion-aware framework – EOSentiMiner – to conduct sentiment analysis for Chinese online reviews from a semantic perspective. The emotion space model is employed to express emotions of reviews in the EOSentiMiner, where sentiment words are classified into two types: emotional words and evaluation words. Furthermore, the former contains eight emotional classes, and the latter is divided into two opinion evaluation classes. An emotion ontology model is then built based on HowNet to express emotion in a fuzzy way. Based on emotion ontology, we evaluate some factors possibly affecting sentiment classification including features of products (services), emotion polarity and intensity, degree words, negative words, rhetoric and punctuation. Finally, sentiment calculation based on emotion ontology is proposed from sentence level to document level. We conduct experiments by using the data from online reviews of cellphone and wedding photography. The result shows the EOSentiMiner outperforms baseline methods in term of accuracy. We also find that emotion expression forms and connection relationship vary across different domains of review corpora.  相似文献   

17.
针对方面级情感分析存在的局部信息捕捉不充分、多个意见词混淆的问题,提出了一种基于词共现的方面级情感分析模型。该模型将方面级情感分析看成句子对任务,利用BERT获得包含上下文与方面词交互注意力的节点信息;同时,对每条数据样本构建独立的词共现图,使用门控图神经网络更新节点,加强方面词附近信息的融合,减少无关意见词的干扰;之后在自注意力层进一步融合全局信息,最终取出方面词节点送入非线性层获得分类结果。与6个基线模型的对比实验结果表明,该模型有效地提升了方面级情感分析的准确性。  相似文献   

18.
传统的微博情感分析往往忽略不带感情色彩的情感词对微博情感的影响,并缺乏对复杂句式的分析。为此,提出结合条件随机场(conditional random filed,CRF)和复杂句式的跨粒度情感分析方法。该方法在CRF模型的基础上,融合复杂句式特征和语义依存特征,对学生微博进行细粒度情感分析,识别出微博文本中的情感要素,在此基础上,通过基于复杂句式的粗粒度情感分析方法分析微博文本的情感倾向,实现对学生总体情感倾向的跨粒度分析。实验结果显示,跨粒度情感分析方法的提出,使得情感要素识别的综合准确率达88%左右,微博情感分析的综合准确率达87%左右。比起传统的情感分析方法,准确率更高,分类效果更好。  相似文献   

19.
微博情感分析是对微博内容进行细粒度的挖掘,有着重要的研究价值。微博评价对象的抽取是微博情感分析研究的关键问题之一。为了提高中文微博评价对象抽取的准确率,该文在中文微博特征分析和微博评论本体构建研究的基础上,尝试从词、词性、情感词以及本体四个方面进行特征选择,采用CRFs模型对评价对象进行抽取。该文将提出的方法运用到COAE2014测评的Task5评价对象抽取任务中,宏平均准确率达到61.20%,在所有测评队伍中居第一。实验结果表明,将本体特征引入到CRFs模型中,能够有效地提高评价对象抽取的准确率。  相似文献   

20.
评论对象抽取是情感分析的重要研究内容。基于语义词典,从评论对象的类别视角出发,运用语义相似度和相关度计算方法,该文提出用于评价对象抽取的七种新的语义特征。评价对象和评价词之间通常存在句法依存关系,并且评价词往往带有情感倾向,将句法依存分析和评价词识别结合,提出句法情感依存特征抽取方法,忽略无情感词和微情感词的句法依存关系,提高评价对象抽取的准确率。使用条件随机场模型,在SEMEVAL比赛的三个领域数据集上进行实验,新的语义特征和句法情感依存特征组合的F1分数比SEMEVAL比赛限制性系统最好成绩平均高3.78%,比非限制性系统最好成绩平均高2%,证明了所提特征的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号