首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 531 毫秒
1.
杨锋  彭勤科  徐涛 《自动化学报》2010,36(6):837-844
提出了一种基于随机网络的在线评论情绪倾向性分类模型SCP-X (Shortest covering path-X). 首先引入了一种增量式创建词语顺序共现随机网络的方法, 并基于此随机网络以及情绪词表, 提出了一种基于评论序列最短覆盖路径(Shortest covering path, SCP)的情绪倾向性分类方法. 该方法具有以下两个优点: 1)能够对相对短小、随意性 较强、完整性较差的评论文本展开词语联想, 从而对完整性较差的评论数据进行属性值扩展; 2) 能够对评论文本的冗余属性进行约简, 约简后数据的属性规模为一般VSM模型 的10%左右. 本文最后设计了一组实验, 对以下算法进行了对比测试: TC, SVM, SCP-TC, SCP-SVM, SCP-HMM, SCP-Bayes. 结果表明本文提出的SCP-X方法对在线评论文本的倾向性分类效果更佳.  相似文献   

2.
该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。  相似文献   

3.
以实现慕课网用户评论的情感倾向性分析为目的,本文提出一种基于BERT和双向GRU模型的用户评论情感倾向性分类方法。首先使用BERT模型提取课程评论文本的特征表示,其次将获取的词语特征输入BiGRU网络实现用户评论的情感特征的提取,最后用Softmax逻辑回归的方式进行情感倾向性分类。实验结果表明基于BERT和双向GRU模型的评论情感倾向性分类模型的F1值达到92.5%,提高了用户情感倾向性分析的准确率,从而验证了方法的有效性。  相似文献   

4.
突发公共事件网络在线评论序列的特征分析*   总被引:1,自引:0,他引:1  
针对网络评论这种新型文本的特点,给出了一组描述网络评论序列特征的指标,提出了一种基于网络评论倾向性的网络评论序列特征分析方法,并结合实例对网络评论序列的特征、网络新闻与其评论序列的关系,特别是谣言对评论序列的影响进行了分析。  相似文献   

5.
针对片段评论文本信息琐碎、片段出现的特点,将文本分类技术应用在对片段评论文本进行分类的研究上,采用了基于主题特征和句子结构的片段文本倾向分类技术。最后,对片段评论文本意见信息进行了倾向性分类实验,并尝试对意见摘要的研究。  相似文献   

6.
在当前的大数据时代,互联网上的博客、论坛产生了海量的主观性评论信息,这些评论信息表达了人们的各种情感色彩和情感倾向性。如果仅仅用人工的方法来对网络上海量的评论信息进行分类和处理实在是太难了,那么,如何高效地挖掘出网络上大量的具有褒贬倾向性观点的信息就成为目前亟待解决的问题,中文文本褒贬倾向性分类技术研究正是解决这一问题的一个方法。文章介绍了常用的文本特征选择算法,分析了文档频率和互信息算法的不足,通过对两个算法的对比和研究,结合文本特征与文本类型的相关度和文本褒贬特征的出现概率,提出了改进的文本特征选择算法(MIDF)。实验结果表明,MIDF算法对文本褒贬倾向性分类是有效的。  相似文献   

7.
基于LSTM的商品评论情感分析   总被引:1,自引:0,他引:1  
随着电子商务的发展,产生了大量的商品评论文本.针对商品评论的短文本特征,基于情感词典的情感分类方法需要大量依赖于情感数据库资源,而机器学习的方法又需要进行复杂的人工设计特征和提取特征过程.本文提出采用长短期记忆网络(Long Short-Term Memory)文本分类算法进行情感倾向分析,首先利用Word2vec和分词技术将评论短文本文本处理为计算机可理解的词向量传入LSTM网络并加入Dropout算法以防止过拟合得出最终的分类模型.实验表明:在基于深度学习的商品评论情感倾向分析中,利用LSTM网络的短时记忆独特特征对商品评论的情感分类取得了很好的效果,准确率达到99%以上.  相似文献   

8.
社交网络舆情分析是一种新的研究趋势,而其中微博话题的情感倾向性判定是社交网络舆情分析中的热点。针对微博内容特征以及微博间转发、评论关系特征,构建情感分析用词典、网络用语词典以及表情符号库,设计基于短语路径的微博话题情感倾向性判定算法,以及基于多特征的微博话题情感倾向性判定算法,并进一步利用微博间的转发和评论关系对基于多特征的微博话题情感倾向性判定算法进行优化,其微平均正确率与F值分别达到85.3%和79.4%。  相似文献   

9.
为了充分挖掘和应用电子商务网站中的教材评论信息,运用细粒度的情感分类算法对用户的在线评论进行分析,基于教材特征级的情感分析结果,辅助潜在客户和商家做出合理有效的决策.本文首先使用爬虫采集教材的在线评论文本,对其进行去噪、分词和词性标注等预处理;然后分析产品特征,在通用情感词典的基础上扩建领域情感词典;最后基于句法分析结果,结合教材评论的语言特性,设计适合教材评论的情感倾向性分析算法,并通过实验验证了算法的有效性.  相似文献   

10.
情感倾向性分类是自然语言处理领域中的热门话题,它的一个重要应用是挖掘线上评论中的重要信息,掌握网络舆论走向,因此本文提出一种基于GDBN网络的文本情感倾向性分类算法.该算法通过引入遗传算法来改进深度置信网络模型中的隐层,使模型自行对隐单元个数寻优,取得当前模型的适宜值,并以此模型进行深层建模与特征提取.最后通过反向传播网络对提取到的特征进行情感倾向性分类.在多个文本数据集上进行实验验证,验证结果表明了本文算法的有效性.  相似文献   

11.
针对中文消费评论的情感分类问题,构建了一种基于语料库的二维坐标映射法的情感分类方法。根据中文语言特点,首先提出了基于语料库的搜索方法,使搜索更有针对性;其次,定义了提取表达情感的中文短语的规则;第三,构造了某领域的最佳种子词选取算法;最后,构造了二维坐标映射算法,通过计算评论句子的坐标值,将其映射到二维直角坐标系中,判断句子的语义倾向性。选取亚马逊网站某商家1200条与牛奶相关的评论(好、差评各600条)进行实验,首先根据最佳种子词选取算法选取“很好漏”作为最佳种子词,再根据二维坐标映射算法判断评论的情感极性,实验的平均F值达到了85%以上。实验结果表明该算法可以对消费评论进行情感分类。  相似文献   

12.
以网络暴力为主的恶意攻击行为已经导致多起恶性事件发生,违规评论问题引起了社会广泛关注。当前违规评论检测手段主要是依靠敏感词屏蔽的方式,这种方式无法有效识别不含低俗用语的恶意评论。该文通过爬虫及人工标注的方式建立一个中文违规评论数据集,采用BERT预训练模型进行词嵌入操作,以保留文本隐含的语义信息。在BERT基础上再利用结合注意力机制的RCNN进一步提取评论的上下文特征,并加入多任务学习联合训练提升模型分类精度及泛化能力。该模型不再完全依赖敏感词库。实验结果表明,该文提出的模型相比传统模型可以更好地理解语义信息,利于发现潜在恶意。该文模型在识别中文违规评论数据集时精确率达到了94.24%,比传统TextRNN高8.42%,比结合注意力机制的TextRNN高6.92%。  相似文献   

13.
网页在线评论情感倾向的直觉模糊分类   总被引:1,自引:0,他引:1  
网页在线评论的情感分类关系到个人决策、企业管理甚至社会安全。提出了一种基于直觉模糊推理的情感分类方法,通过样本库的学习将特征在分类时的不确定性分别用隶属度、非隶属度、犹豫度定量地描述,同时定量地考虑程度副词、转折词、否定词对表达情感的作用,然后通过对特征的直觉模糊信息的集结,按词组、句子、文本三个级别依次合其情感倾向,得到文本的情感倾向。在对公开语料库的比较实验中证明了该方法的正确性和分类性能。  相似文献   

14.
随着互联网和信息技术的迅速发展,网络上用户的评论信息越来越多。利用计算机技术分析网络中大规模文本的情感倾向,在政府的舆情分析和企业的产品评价智能回馈等应用中有着非常巨大的发展前景。文中着重研究了选取不同的文本特征对文本情感倾向性分类精度的影响。实验中所研究的不同文本特征主要包括情感词、形容词、副词、语气词和标点符号等。实验结果表明,选取情感词、形容词、副词作为特征项对情感分类具有较好的效果,在此基础上添加语气词和标点特征可以有效地提高情感分类的精度。该研究成果可用于社会舆情分析、垃圾博客过滤、商品评论与推荐、影视评价等领域。  相似文献   

15.
随着电子商务,个人博客,社交网站和微博的蓬勃发展,互联网进入了一个崭新的时代,而在线评论的情感分类关系到个人决策、企业管理甚至社会安全.提出了一种基于区间直觉模糊的情感分类模型,采用了区间直觉模糊算子来计算特征词的区间直觉模糊数,利用区间直觉模糊集的隶属度、非隶属度和犹豫度分别定量地描述特征词,通过情感合成确定文本的情感倾向,从而获得准确率较高的情感倾向性分析结果.最后通过相同语料库的比较实验证明该分类模型的可行性、正确性和较高的分类性能.  相似文献   

16.
目前,针对微博领域的谣言检测方法主要基于微博正文,同时辅以用户评论特征、传播特征等信息进行判定。然而已有方法没有考虑用户评论质量会直接影响谣言检测的性能,质量低的评论甚至会引入无用甚至负面的特征,进而对谣言检测的性能带来更大的影响。针对该问题,基于用户评论和谣言检测的关联性,首次提出一种考虑评论有效性,并基于多任务联合学习的谣言检测方法。首先将谣言检测作为主任务,用户评论相关性检测为辅助任务;然后采用门控机制和注意力机制过滤和选择有效的用户评论特征;最后基于自主构建的3万条疫情微博谣言数据集进行实验。实验结果表明,对用户评论进行筛选不仅可以提升谣言检测性能,还能对用户评论质量进行判定。  相似文献   

17.
针对网购评论命名实体识别中重要词汇被忽略的问题,在评论短文本处理基础上,借鉴多头注意力机制、词汇贡献度和双向长短时记忆条件随机场提出一种基于MA-BiLSTM-CRF模型的网购评论命名实体识别方法。首先,用词向量和词性向量的组合来表示评论文本语义信息;其次,用BiLSTM提取文本特征;然后,引入多头注意力机制从多层面、多角度提升模型性能;最后,用条件随机场(CRF)识别命名实体。实验结果表明,该方法能提升网购评论实体识别效果。  相似文献   

18.
针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信息中的关键特征,并融入到情感向量空间中。最后利用机器学习分类算法,实现中文评论文本的情感分类。实验结果表明,提出的方法有效降低了特征向量的维度,并且在文本情感分类上有很好的效果。  相似文献   

19.
网购评语是消费者对网购商品的直接反馈,从中挖掘有价值的知识有助于为商家开展精准化营销和个性化推荐服务、消费者制定购买决策等提供依据。鉴于此,以国内大型综合型电商平台上服装类网购评语为研究对象,对评语分词、筛选高频词,分析高频词之间的共现关系,构建高频词共现网络,分析得出网络评语的热点词多个结构特征和评语网络中少数节点对网络的运行起着主导的作用,为网购评语挖掘研究领域提供了按照网购评语高频词共现网络的结构特性对销量的交互影响进行研究的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号