首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
通过自然语言处理技术,实现对商品评论数据的可视化流程分析,利用八爪鱼采集器对京东商品评论数据进行采集,对文本数据进行去重、分词、去停词等预处理,再结合TF-IDF算法来提取文本数据特征词,利用R软件建立LDA主题模型并提取主题,使用LDAvis可视化工具对主题模型进行交互式可视化分析,并结合词云图将评论文本数据以更直观的方式展现出来,从而挖掘消费者重点关注的评论词语,结合主题模型和词云图两种可视化方法将用户评论情感数据通过丰富的图形进行内容展示,可以使情感分析的结果更准确、更全面反映产品和客户需求,为消费者的购买和商家的改进提供依据。  相似文献   

2.
针对用户评论文本情感分类过程中缺乏特征词语义分析和数据维度过高的问题,提出了一种基于语义分析的在线评论情感分类方法。利用Word2Vec工具获得词向量,通过词向量运算获取评论文本中的词与情感词典中的词之间的语义相似度,然后根据此相似度的大小选择反映正面或负面情感的词作为评论文本的关键特征。通过非负矩阵分解算法,将原始评论文本映射到一个低维的语义空间,降低评论数据维度,增强评论文本之间的语义相关度。实验表明,提出的算法具有更好的文本情感分类能力。  相似文献   

3.
为了研究基于群体智能挖掘的个性化商品评论呈现方法,以大众点评用户评论为研究对象,对大众点评中的用户评论进行特征提取,并发现兴趣相似的用户.特别是提出基于情感特征和主题分布特征的相似群体发现方法,通过提取用户历史评论的情感特征和主题分布特征,刻画用户之间情感和主题的相似度,并发现兴趣相似的用户群体,实现个性化评论呈现.实验结果表明,采用提出的方法可以体现用户间兴趣的相似性并发现与用户有相似兴趣的群体,向用户个性化呈现评论.  相似文献   

4.
移动互联网的快速发展使得网络上数据量剧增. 如何从纷繁复杂的信息中提取出对人们有用的信息就成为一个亟待解决的课题. 本文提出一种改进的基于情感词典的倾向分析方法,该方法在情感词典中加入领域情感词,并且通过构建辅助词典集来进行辅助分析. 同时给出了一种半自动的词典维护方法来发现新词和更新词典集. 通过对手机领域的评论进行文本级的情感倾向分析,正面情感分析的准确率和召回率达到0.713和0.769,负面情感的准确率和召回率达到0.738和0.706,与传统基于情感词典的方法相比准确率和召回率都有较大提高.  相似文献   

5.
为了解决细粒度情感识别效果欠佳和深度学习方法可解释性差等问题,提出一种将本体与深度学习融合的细粒度情感分析模型。在模型中,将领域本体与卷积神经网络相融合,以识别文本中的显式和隐式主题。同时,将情感词典、双向长短时记忆网络和注意力机制相结合,用于分析在线评论文本的细粒度情感。实验结果表明,与其他方法相比,所提的细粒度情感分析方法在准确率、召回率和F1值等方面均具有一定的优势。  相似文献   

6.
为了研究在不同类型重大公共事件下实施交通管控引起的舆情差异,从网络舆情角度,构建适用于交通管控舆情分析的情感与主题挖掘协同分析模型.在模型中建立面向重大公共事件下交通管控舆情的情感词典库,基于朴素贝叶斯分类算法进行情感分析,采用LDA主题模型法进行主题挖掘.以常规公共事件与突发公共事件下的交通管控为研究对象,通过爬取微博平台网民的评论数据,对比不同类型事件下交通管控网络舆情变化差异.结果表明,常规公共事件与突发公共事件下的交通管控舆情情感值分别为0.75~0.95与0.35~0.85.不同类型重大公共事件下交通管控舆情出现消极主题词的因素更加复杂,而积极主题词的相似度更高.突发公共事件中交通管控舆情主题词的热度变化趋势在事件初期急剧上升,然后逐渐下降趋于平缓,而常规公共事件下的趋势没有明显规律.  相似文献   

7.
为了提高文本观点挖掘的效率,通过扩展标准话题模型,提出了一种新颖的多粒度话题情感联合模型(MG-TSJ).模型将文本话题区分为全局和局部两类,同时挖掘文本中涉及的多层次话题信息和情感倾向信息.该模型采用非监督的学习方法,解决了现有方法存在的领域依赖问题.通过在测试语料库上进行实验,该模型在文本情感倾向性分类任务中的准确率达到82.6%,具有和监督分类系统相当的性能;挖掘话题集合呈现层次化、语义相关的特点,证明了MG-TSJ模型对观点挖掘是可行的和有效的.  相似文献   

8.
针对基于评论文本推荐系统的特征没有充分组合的问题,提出一种利用双重注意力实现评论特征组合的推荐模型.首先利用经情感分类任务微调后的编码模型对评论文本进行编码,得到对应的特征向量;然后利用双线性内积计算用户与商品之间评论特征向量的交叉注意力,实现用户和商品之间评论特征的交叉组合;再利用多头自注意力实现用户和商品对应评论特征的自组合,得到用户和商品最终的特征表示.在真实数据集上的实验结果表明,所提模型的均方误差相比其他模型下降了1.43%.  相似文献   

9.
针对现有领域情感词典在情感和语义表达等方面的不足,提出一种基于词向量的领域情感词典构建方法。利用25万篇新闻语料和10万余条酒店评论数据,训练得到word2vec模型;选择80个情感明显、内容丰富、词性多样化的情感词作为种子词集;利用TF-IDF值在词汇重要程度的度量作用,在酒店评论中获得9 860个领域候选情感词汇;通过计算候选情感词与种子词的词向量之间的语义相似度,将情感词映射到高维向量空间,实现了情感词的特征向量表示(Senti2vec)。将Senti2vec应用于情感词极性分类和文本情感分析任务中,试验结果表明,Senti2vec能实现情感词的语义表示和情感表示;基于特定领域语料的语义相似计算,使得提取的情感特征更具有领域特性,同时不受候选情感词集范围的约束。  相似文献   

10.
针对描述客观事实评论中量化的情感特征片面问题,提出一种基于情感特征的主客观分类方法。将基于情感词典与机器学习结合得到的积极或消极情感权值与概率,作为新的情感特征项与评论文本的语言、属性和信息特征相结合,重新确定影响用户行为的情感特征,从而对评论文本进行主客观分类。实验结果表明,采用支持向量机算法可使基于情感特征的主客观分类效果更佳,准确率为87.20%。  相似文献   

11.
情感计算是对文本进行情感分析与挖掘,得出文本评价调性的过程。基于知网的情感计算方法首先依据知网"情感分析用词语集"构建情感词典,然后计算文本中特征词汇的情感倾向,最后通过累加得出文本的情感倾向。实验结果表明,在设定一个合理中性阀值后,能较好地计算出特征词汇和篇章的情感倾向,有较高的查全率和查准率。  相似文献   

12.
如何从海量的专利信息中挖掘出不同专利之间隐含的关联关系是很多专利管理系统迫切需要解决的问题.本文从专利文本的摘要出发,提出一种基于Apriori和引入LDA主题模型的专利文本分析方法.首先,采用Apriori算法对数据降维,挖掘关键词和主题词之间的关联规则并根据规则绘制共享主题网络图,然后使用LDA主题模型对离散化的专利-主题词矩阵进一步线性降维,并将主题聚类,得到主题细分下的高频词主题,最后结合两种分析方法的结果对专利文本进一步挖掘分析.本文所使用的方法能够有效地挖掘出专利文本数据间的关联,可以为专利间的关联推荐提供思路和应用参考.  相似文献   

13.
一种基于朴素贝叶斯的中文评论情感分类方法研究   总被引:2,自引:1,他引:1  
提出一种新的基于朴素贝叶斯的中文文本情感分类方法。该方法用情感短语作为文本特征,通过情感词典与否定副词相结合,提取情感短语,通过CHI统计法设定阈值进行特征提取,再利用朴素贝叶斯分类器进行情感分类计算。对不同CHI阈值、不同语料库、以情感短语为特征和以情感词为特征进行分类实验。实验表明,以情感短语作为特征进行朴素贝叶斯分类,在不同领域的评论中均获得了较高的查准率和查全率,证明了该方法的可行性。  相似文献   

14.
针对短文本在情感极性判断上准确率不高的缺点,在隐含狄利克雷分配(latent Dirichlet allocation, LDA)的基础上提出一种适用于短文本的情感分析模型。该模型在短文本中按词性寻找情感词汇,并对其进行有约束的词语扩充形成扩充集合,增强情感词汇之间的共现频率。将扩充集合加入文本中已发现的情感词汇,使得短文本长度增加并且模型可以提取到情感信息,模型通过这种方法将主题聚类变成情感主题聚类。该模型使用4 000条带有正负情感极性的短文本进行验证,结果表明该模型准确率比情感主题联合模型提高约11%,比隐含情感模型提高约9.5%,同时可以发现更多的情感词汇,证明该模型对于短文本能够提取更丰富的情感特征并在情感极性分类上准确率较高。  相似文献   

15.
虚假评论的检测与治理,对净化网络环境具有重要的意义。针对现有的虚假评论检测方法收敛速度慢、准确率低的问题,提出一种融合评论情感特征的虚假评论检测方法。首先,基于预先构建的情感词典,设计情感特征抽取方法抽取情感特征;其次,引入 Transformer模型对融合情感特征后的嵌入表示提取特征向量;最后,将特征向量送入全连接层并利用 softmax函数实现真实评论与虚假评论分类。采用 Amazon数据集,设计实验验证了基于情感词典所提情感特征的有效性,在融合情感特征后准确率提升了1.19百分点;同时与深度学习ISTM方法相比,该方法检测准确率提高0.59百分点。  相似文献   

16.
针对因数据量的增加以及异常评论策略的更新,以用户内容和行为为基础的传统微博异常评论识别方法效果不断下降的问题,提出一种基于情感分析和质量控制的微博异常评论识别方法.通过将预处理后的微博评论进行情感分析,将微博评论进行量化处理,在对微博评论进行质量控制的过程中,根据异常与正常用户在时域上对热点微博的评论分布差别检测可疑时间间隔,结合用户聚类分析,设计了异常评论识别模型.结果表明:该方法利用情感评分,对于评论文本进行较为准确的情感分类,然后通过调整边界值范围和时间阈值范围来限定异常检测等级,当边界值范围增大时,对于异常评论的检测范围扩大,容忍度下降,检测灵敏度高;当时间阈值扩大时,容忍度提高,检测灵敏度较低;适当的选择边界值和时间阈值,可以有效提高与正常评论行为相似的异常评论识别准确率.  相似文献   

17.
针对中文酒店评论自身特点设计语料特征,将评论高频词赋予权重并扩展基础情感词典;结合扩展基础情感词典和语义规则,计算情感加权值,实现对酒店频率褒贬倾向分析;选取Boson和大连理工情感词典作为基础情感词典进行了试验。试验结果表明,利用本方法进行中文酒店评论情感分析的精准率可达到90%以上,相比基础情感词典,可提高10%,且加入前50个高频词扩展基础情感词典,对精准率有较大提升,之后精准率的提升速度趋于平缓。  相似文献   

18.
目前对微博评论的研究主要聚焦在影视、购物等非电力领域,而对电力领域的研究相对较少.因此在影视等领域的研究基础上,根据电力行业的特性,将评论进行预处理后,建立评论关系树,使用动态扩展情感词典和基于支持向量机的方法,建立情感极性判别规则,进行情感极性分析.经实验验证,生成评论关系树后,扩展情感词典和支持向量机两种方法在电力领域的正确率均得到了明显的提升.  相似文献   

19.
提出了一种加权的基于LDA(Latent Dirichlet Allocation)的协同过滤算法,通过对传统协同过滤算法优缺点的分析,联合打分数据和评论数据的特征进行推荐。该算法主要研究用户评论文本的特点,通过LDA主题模型对评论文本集合进行主题提取,使用相对熵的方法计算相似度,在此基础上,研究用户评分对于每条评论文本的影响,联合LDA进行评分预测及推荐。实验结果表明,该算法能够显著提高推荐准确度。  相似文献   

20.
克服当前文本分类法中基于词形匹配带来的局限性,基于WordNet语义词典和隐含语义索引(LSI)模型,提出了基于语义集索引的英文文本分类方法. 该方法在分类初期首先利用WordNet构建语义词典库,利用单词的语义集代替单词作为文本特征向量的特征项;然后利用LSI模型进一步深入挖掘语义集概念间的深层联系,将语言知识和概念索引有效地融合到文本向量空间的表示中. 针对Naive Bayes及简单向量距离文本分类法的实验结果显示,2种文本分类法的分类准确率均随着语义分析的深入逐步提高,充分表明了语义挖掘对文本分类的重要性和必要性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号