首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
为挖掘大量的电子商务产品评论数据隐藏的巨大潜在价值,构建产品评论数据库,提取特征-情感词集,对情感极性进行计算并对关注点进行挖掘。实验结果表明:该方法得到的产品热门特征标签与官网热门标签高度吻合,可以推广到其他中文在线网络评论。  相似文献   

2.
为实现产品意见挖掘中的隐式产品属性抽取,在传统主题建模思想的基础上,通过分析评论信息中不同产品属性对应的意见词分布以及意见词的主题依赖性假设,提出一种基于正则化思想的新主题建模框架.在该框架下,评论信息中的意见词特征,通过定义在不同评论中意见词的使用相似度上的正则化因子,纳入到传统的主题建模框架中.正则化的基本思想为:若2条评论在意见词的使用模式上相似,则它们评论相同的产品属性的概率越高.定性和定量2种实验结果均表明,本文的正则化主题模型较传统的主题模型算法有更高的准确率,说明本文的正则化思想是有效的.  相似文献   

3.
对物流评论进行情感分析可以发现用户的投诉热点,有助于改善物流企业的服务质量.首先基于词性、评价词、评价对象的搭配规则、词频和PMI方法对物流评论中的评价对象进行抽取.然后,建立4种情感词库及评价词极性计算规则,计算物流企业评论的情感倾向性.结果表明:"四通一达"在速度、服务、价格等5个方面的情感倾向值存在一定差异,各企业可针对实际情况进行改进.  相似文献   

4.
由于传统褒贬二值分类模型缺乏对文本主题之间以及主题与观点持有者之间的关系挖掘,不能很好的处理具有不规则、口语化、极性强等特点的评论文本.通过提取网站的文本评论,对评论对象进行结构化处理,以How Net公布的情感词典为基础,完善了评论情感倾向性词典.结合五元组模型量化文本情感信息,建立了适合处理评论文本的模型,深度挖掘了用户对商品或消费行为的主观感受.并通过实验验证了该模型的准确度和有效性.  相似文献   

5.
针对LSTM网络进行主题词提取时因没有考虑中心词的下文对主题词的影响而导致提取准确率低的问题,提出了一种双向LSTM引入Attention机制模型(Att-iBi-LSTM)的主题词提取方法。首先利用LSTM模型将中心词的上文和下文信息在两个方向上建模;然后在双向LSTM模型中引入注意力机制,为影响力更高的特征分配更高的权重;最后利用softmax层将文档中的词分为主题词或非主题词。并且还提出了一种两阶段模型训练方法,即在自动标注的训练集上进行预训练之后,再利用人工标注数据集训练模型。实验在体育、娱乐和科技3种新闻文本上进行主题词提取任务,实验结果表明本文提出的Att-iBi-LSTM模型与SVM、TextRank和LSTM相比F1值分别提高了13.78%、24.31%和3.32%,使用两阶段训练方法的Att-iBi-LSTM比一阶段训练的F1值提高了1.56%。  相似文献   

6.
通过自然语言处理技术,实现对商品评论数据的可视化流程分析,利用八爪鱼采集器对京东商品评论数据进行采集,对文本数据进行去重、分词、去停词等预处理,再结合TF-IDF算法来提取文本数据特征词,利用R软件建立LDA主题模型并提取主题,使用LDAvis可视化工具对主题模型进行交互式可视化分析,并结合词云图将评论文本数据以更直观的方式展现出来,从而挖掘消费者重点关注的评论词语,结合主题模型和词云图两种可视化方法将用户评论情感数据通过丰富的图形进行内容展示,可以使情感分析的结果更准确、更全面反映产品和客户需求,为消费者的购买和商家的改进提供依据。  相似文献   

7.
为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模型,使其对评论原文的句首具有更高的注意力权重,并可端到端地生成评论摘要的每一个词.实验结果表明,该模型在对英文同类别全文长度小于200的评论摘要提取上有更高的准确率.  相似文献   

8.
针对获取互联网上汽车评价信息的需求,提出了一种基于领域本体的汽车口碑挖掘方法.该方法在构建汽车领域产品及评论本体的基础上,重点研究了评论句子、比较评论句子的识别及倾向性判定方法.收集了太平洋汽车网的评价语料进行了实验比较,结果验证了所提方法在汽车口碑挖掘应用中的有效性.  相似文献   

9.
为了解决传统的深度学习模型会忽略语料库中全局词共现信息所包含的非连续和长距离语义的问题。本文提出记忆图卷积神经网络(MGCNN)引入注意力机制的商品评论情感分析方法。首先提取词与词、词与文档之间的关系,以全部的词和文档作为节点,将整个数据集构造成一个异构文本图。再基于图卷积网络(GCN)来构建用于图结构数据的神经网络,利用长短期记忆网络(LSTM)提取上下文相关特征,并使用注意力层获取重要特征。多组对比实验结果表明,本方法的分类效果更好,且随着训练集数据所占比例的降低,其优势更加显著。  相似文献   

10.
PageRank模型在中文情感词极性判别中的应用   总被引:1,自引:1,他引:0  
针对倾向性分析任务重的基础性工作——情感词的极性判断工作,提供了一种基于PageTank模型的情感词极性判断方法.由待判别情感词和少量中子情感词构成图中的节点,利用知网(HowNet)语义资源计算词语间的语义想死度,进而得到图中节点间边的权重.通过PageRank模型的引入,综合利用有标种子情感词和无标待判别情感词实现对无标情感词的极性判别.与传统的基于HowNet的情感词判别方法相比,PageRank模型的引入使情感词判别的准确率平均提高10%左右,充分验证了所提方法的可行性.  相似文献   

11.
针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。  相似文献   

12.
随着互联网技术的飞速发展,博客、社交网络、微博等平台的出现,使得人们在网络上发表个人观点变得更为方便快捷.从海量的数据中提取出消费者、商家、政府等群体需要的信息,并对其进行分析、总结,从而形成有针对性的、可读性强的分析结果.以观点挖掘的流程为线索,从观点提取、极性分析、观点总结等方面对观点挖掘做了较为全面的分析.其中观点提取部分介绍了域依赖性的概念,并例举观点句提取所采用的主要技术;极性分析部分对有监督学习与无监督学习、定性判断极性与定量判断极性进行对比;而观点总结部分则简要介绍了基于方面、观点对比和关键语句等总结的形式.还介绍了在不同的挖掘粒度上所运用的技术,涉及信息检索、自然语言处理、机器学习等.最后,总结了观点挖掘技术中依然存在的具有挑战性的问题,并预测未来观点挖掘领域的研究趋势.  相似文献   

13.
针对基于词典的传统分类器无法对不在词典中的情感词的极性和强度进行有效计算和细分的问题,基于最大期望模型,提出构建完善情感词典的EM-SO算法,在此基础上设计基于语义倾向计算模型的否定式和强(弱)化处理组件,以获取评价词及其修饰词的组合效应。实验结果表明,所提算法及所设计组件在评论集上对情感词极性和强度的计算性能优于SO-CAL模型,可应用到主观性分类等实际任务中。  相似文献   

14.
中文产品评论特征词与关联的情感词的分类是观点挖掘的重要研究内容之一. 该文改进了英文依存关系语法,总结出5种常用的中文产品评论依存关系; 利用最大熵模型进行训练,设计了基于依存关系的复合特征模板. 实验证明,应用该复合模板进行特征-情感对的提取,系统的查全率和F-score相比于传统方法,分别提高到78.68%和75.36%.  相似文献   

15.
以"墨墨背单词""百词斩"和"扇贝单词"三个英语背单词App为研究对象,通过对社交媒体上相关App用户的在线评论文本的情绪挖掘,从中发现用户使用这些App所关注的属性信息及其情感极性,并以VIKOR多属性决策方法分析用户对于使用App所关注的各个属性的满意程度.研究表明:用户关注属性的程度从大到小依次为实用、效率、易用、经济、美观,"墨墨背单词"实用和效率属性较好,"百词斩"和"扇贝单词"的用户满意度有待提高.  相似文献   

16.
给出了一种基于快速排序和归并排序的高阶汉语大标记集Markov统计语言模型的统计算法,并对算法的时间复杂性和空间复杂性进行了分析。依据这种统计算法,设计实现了一个汉语字(词)概率统计系统。通过对上千万字的汉语语料的统计,建立起了汉语字(词)一元、二元和三元Markov模型,并对统计结果进行了分析。  相似文献   

17.
提出了一种基于信息墒和词语活跃度的领域词抽取方法,通过对语料进行预处理,提取出候选领域词,计算所有候选领域词的正规化类间分布(NCD)和正规化类内分布(NDD),设置阈值对候选领域词过滤,最后分析了双字候选领域词中包含的常见噪音词语,使用词语活跃度对候选领域词中的双字词语进行过滤,该方法综合考虑了领域词在类别中的概率分布和领域词的内部特征。实验结果表明,该方法在领域词的识别上具有较好的准确率和召回率。  相似文献   

18.
<正>(一)《西北工业大学学报》的学术面貌似可定性定量地用重要的Ei主题词两年出现的个数及每个主题词出现的篇数来描述。两年出现了577个Ei主题词,其中192个是21世纪才出现的。重要的Ei主题词似为29个21世纪才出现的及20个2000年以前已出现的,29个词每个词都在4篇以上出现,20个词每个词都在20篇以上出现。(二)29个在4篇以上两年《西北工业大学学报》论文出现的21世纪主题词  相似文献   

19.
基于意见领袖概念的本质, 运用观点挖掘技术研究突发事件中微博意见领袖的识别, 为网络舆情治理提供参考。提出三步识别方法框架: 首先采用文献分析法构建指标模型, 评价微博博主的信息影响力; 其次构建文本主客观分类模型, 计算高影响力博主事件相关博文的观点输出性, 识别观点博文; 然后针对观点博文的评论文本构建情感极性分类模型, 计算博文观点获得的支持度以及博主观点的支持率, 最终将输出了观点并获得较多支持的高影响力博主作为该事件的“意见领袖”。同时, 运用上述方法对典型实际案例的微博舆情数据进行分析, 识别该事件的微博意见领袖, 对其特征和舆情参与行为进行观察。并将该结果与社会网络分析法、专家人工分析法识别的结果进行了对比, 验证了本方法的科学性和有效性。结果表明, 本方法能够识别在突发事件舆情生命周期中真正拥有舆论引导力, 具备治理价值的微博意见领袖。  相似文献   

20.
针对用户评论文本情感分类过程中缺乏特征词语义分析和数据维度过高的问题,提出了一种基于语义分析的在线评论情感分类方法。利用Word2Vec工具获得词向量,通过词向量运算获取评论文本中的词与情感词典中的词之间的语义相似度,然后根据此相似度的大小选择反映正面或负面情感的词作为评论文本的关键特征。通过非负矩阵分解算法,将原始评论文本映射到一个低维的语义空间,降低评论数据维度,增强评论文本之间的语义相关度。实验表明,提出的算法具有更好的文本情感分类能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号