首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对中文微博情感倾向性分析问题,将中文微博情感分析分为3大部分:中文分词、情感词语定位和情感倾向性判断,给出了中文分词的具体方法,即基于隐马尔可夫模型(HMM)的维特比算法.分析不同种类的情感词对情感倾向性判断的影响,并设计情感得分计算方法,根据得分分析人们对舆情的态度,从而更加准确地分析各类文本的情感倾向性.通过Python从新浪微博爬取200篇文章,通过实验分析得出正向情感128篇,中性情感20篇,负向情感52篇,验证了基于HMM的维特比算法以及基于情感词典的情感倾向性分析方法能有效地判断出微博文本的情感倾向性.  相似文献   

2.
介绍了文本分类技术和文本倾向性分类技术,并基于文本倾向性分类技术分析了图书评论中的信息,研究如何将机器学习方法应用在图书评论的倾向性分类中,提出了一种图书评价模型构建的解决方法.  相似文献   

3.
专利的复杂性、结构化、抽象性和唯一性等特点使专利的检索与分析方式比传统文本遇到更多的挑战,专利研究正从专利数据库的构建、检索逐步向专利的分析和挖掘方向发展.首先对专利检索的3个关键点:文档建模、无效性检索和检索评价的研究现状进行了总结,对目前所取得的主要研究成果做了介绍和对比.接着,着重从专利分析的3个方面:专利技术功效分析、专利聚类和质量分析,阐述了国内外学者所取得的主要研究成果.最后,展望了未来专利检索与分析领域的研究热点和方向.  相似文献   

4.
为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有方法存在的领域依赖问题.通过在测试语料库上进行实验,该模型在文本情感倾向性分类任务中的准确率达到82.6%,具有和监督分类系统相当的性能;挖掘话题集合呈现层次化、语义相关的特点,证明了MG-TSJ模型对观点挖掘是可行的和有效的.  相似文献   

5.
为了有效地对不断涌现的海量互联网信息进行采集、分析、检索,基于网络舆情分析涉及到的热点发现与文本倾向性分析两个关键技术,改进了相似主题检测和基于语气标注方法的文本倾向性分析算法.实验结果表明,直接通过关键词匹配法,误差较大;基于关联规则的相似主题检测,可以明显提高检测精度.同时,无论是对正面文档还是对负面文档,经过改进...  相似文献   

6.
聚类分析是挖掘数据内在结构的关键技术,在大数据时代,人们面对的数据通常具有规模大、维度高、结构复杂等特点,直接应用传统聚类算法往往会失效.深度学习凭借层次化非线性映射能力使得大规模深度特征提取成为可能,因此基于深度学习的聚类(深度聚类)算法迅速成为无监督学习领域的研究热点.该文旨在对深度聚类的研究现状进行归纳和总结.首先,从神经网络结构、聚类损失和网络辅助损失3个角度介绍深度聚类的相关概念;然后,根据网络的结构特点对现有的深度聚类算法进行分类,并分别对每类方法的优势和劣势进行分析和阐述;最后,提出好的深度聚类算法应具备的三要素:模型的可扩展性、损失函数的鲁棒性和特征空间的平滑性,并从这3个方面分别阐述未来可能的研究方向.  相似文献   

7.
现有研究较少涵盖最先进的多目标粒子群优化(MOPSO)算法.本研究介绍了多目标优化问题(MOPs)的研究背景,阐述了MOPSO的基本理论.根据特征将其分为基于Pareto支配、基于分解和基于指标的3类MOPSO算法,介绍了现有的经典算法.介绍相关评价指标,并选取7个有代表性的算法进行性能分析.实验结果展示了传统MOPSO和3类改进的MOPSO算法各自的优势与不足,其中,基于指标的MOPSO在收敛性和多样性方面表现较优.对MOPSO算法在生产调度、图像处理和电力系统等领域的应用进行简要介绍.并探讨了MOPSO算法用于求解复杂优化问题的局限性及未来的研究方向.  相似文献   

8.
对标量化Ⅲ聚类统计方法进行了说明和简单证明,并应用此方法对商业服务调查中经常遇到的类别数据,即对文本数据进行了分析.通过计算文本数据的特征值和类得分,实现了对文本数据的特征描述,并将各类的特征直观地表现在二维坐标系中.实例分析结果表明这种处理方法比传统分析方法更有效.  相似文献   

9.
为了提高政府事务管理水平和处理效率,打造“智慧政务”平台,针对政务服务中群众留言的答复内容进行客观评价,提出了一种结合多算法的群众留言回复评价模型.首先,根据答复文本内容定义答复长度、相似性、完整性、可解释性和及时性5个评价特征指标,分别从内容、格式、合理程度和时间4个角度对文本进行评价;其次,采用回归分析方法对答复意见类型进行分析;接着,分别采用K-means聚类、DBSCAN聚类算法、Meanshift聚类算法、HC聚类算法对答复意见等级进行分析,根据4种聚类算法效果对比结果,选用K-means聚类算法,再将聚类算法和回归分析的结果结合,对答复意见进行评价,并将评价等级分为6类.本文模型将机器学习中的数据挖掘和数据分析算法与“智慧政务”相结合,为政府事务管理的研究提供了一个量化分析的工具.  相似文献   

10.
本文在前人工作的基础上,提出了一种新的时间序列分析模型,在实时建模意义上开拓了目前时变ARMA模型类时间序列分析方法的应用范围,并对一些现有的模型作了概括和某些合理改进.本文给出了该模型的实时建模方法.  相似文献   

11.
表情符号已成为网络语言重要组成部分,是分析社交媒体情感的主要特征之一.目前分析社交媒体情感符号的方法多针对Emoji,对颜文字的情感倾向没有相应分析.为获取中文媒体的多维度情感并分析热点话题的群体情感走向,本文以微博为例提出一种新的融合表情符号与短文本的多维情感分类方法.在该框架中,采用深度学习模型分析文本与Emoji组合部分、颜文字部分,分别计算两部分的7种情感强度,挖掘各部分与情感标签的深层次关联,并设计计算模型来反映语句包含的多维情感属性,实现对语句多维情感强度的检测.实验选择NLPCC2014数据集和爬取的带有颜文字的微博数据集进行验证,实验证明当文本与Emoji组合、颜文字占比分别为0.6和0.4时情感分类效果最好,且含颜文字的语句情感分类性能指标始终高于不含颜文字的语句,这表明融合表情符号和短文本的形式有效提高了情感检测精度.该方法为研究群体情感趋势提供了更细粒度的分析,为中文社交媒体的情感分析提供了新思路.  相似文献   

12.
提出了一种新的特征提取方式,与三支决策思想相结合,运用在文本情感分析中,以提高分类器的效率。根据训练集合创建动态情感词典,然后根据情感词典提取文本的抽象特征,形成特征矩阵。在分类过程中,如果分类器对于目标文本的所属分类确信程度不够高,那么分类器会利用三支决策的思想,将文本置于边界域中,等待别的处理方法。实验结果表明,在英文影评数据集上,基于动态词典的特征提取方法可以取得更好的分类准确率,而且三支决策规则可将一些样例放入边界域,提高了分类准确率。  相似文献   

13.
针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation, LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。  相似文献   

14.
文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.  相似文献   

15.
基于特征选择技术的情感词权重计算   总被引:2,自引:0,他引:2  
在文本情感分析中,情感词典的构建至关重要,然而目前这方面的研究大多集中在简单的词语极性判别上,有关情感词的权重赋值研究较少,且已有的权重赋值方法基本上都需要人工辅助来选取基准词,这给实际应用带来很大的困难. 针对此问题,提出了一种自动的基于特征选择技术的情感词权重计算方法. 首先提出了词语情感权重与文本情感倾向的相关假设;然后针对情感分类,结合二元分类的特性改进了信息增益( information gain, IG)和卡方统计量( chi-square,CHI) ,将特征选择技术应用于情感词权重计算. 实验结果表明:将计算所得的带情感权重的情感词库用于文本情感分类能够提升分类精度.  相似文献   

16.
针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。  相似文献   

17.
对现有情感词典在微博情感分类中的适用性进行了分析,针对现有情感词典在微博中情感词覆盖度低的问题,整合现有情感词典资源,构建了一个微博基础情感词典,同时提出了一种基于拉普拉斯平滑的SO-PMI算法对微博基础情感词典中没有收录的情感词倾向性进行判断,最后利用微博情感词典与拉普拉斯平滑的SO-PMI算法对微博情感词典进行了构建,并对所构建微博情感词典的分类性能进行了实验。实验结果表明,该方法所构建的情感词典在微博情感分类中能达到较好的分类效果。  相似文献   

18.
文本情感极性分类是文本情感分析首先要解决的关键问题。在分析影响文本情感分类的各类因素的基础上,首先构建了情感词典,并进行情感特征选取以及情感特征加权,然后使用SVM分类的方法对文本进行情感识别及分类,最后在语料数据集的基础上,在单机平台上和Spark分布式计算平台上执行分类模型,对比分析其分类精度和时间代价。实验结果验证了本文构建的情感极性分类模型在单机和分布式云平台上中的有效性。  相似文献   

19.
微博作为最受欢迎的社交网络平台之一,是人们表达观点和情感的重要途径.性格影响人的情感表达方式.针对现有微博情感分析很少考虑性格因素这一问题,文章提出一种基于BiLSTM+Self-Attention并结合性格因素的微博情感分类模型(P-BiLSTM-SA).该模型首先根据"大五"人格理论,基于用户性格将微博文本进行性格...  相似文献   

20.
为了解决图像情感分析中存在的情感鸿沟和大的类内方差问题,提出了一种可以同时利用视觉模态和文本模态之间的深度潜在关联、视觉模态的深度线性判别和图像中层语义融合的弱监督方法.利用多模态深度网络结构找到一个视觉模态和文本模态之间最大深度关联且视觉模态具有深度判别性的潜在嵌入空间,并在该潜在空间中将文本的语义映射特征迁移到图像的判别性视觉映射特征中;结合注意力机制,设计涵盖潜在空间中映射特征的注意力网络,用于情感分类.在真实数据集上的实验结果表明,所提出的方法获得了更好的情感分类准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号