首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
随着互联网的快速发展,互联网用户更倾向于在博客、购物网站等场所借助于发表文章、评论等手段表达自己对感兴趣话题的关注、意见和相互交流。对这些用户生成内容进行挖掘可以得到很多宝贵的可应用于很多领域的知识,但其中存在的不请自来、与话题无关(广告等)或虽与话题相关但是虚假性的内容严重影响了挖掘的效果,并产生了误导用户、浪费资源等不良影响。因此,作为意见挖掘研究工作重要组成部分的垃圾意见研究工作开始得到空前的重视。从垃圾意见特征、垃圾意见检测方法两个方面对目前垃圾意见的研究状况进行了综述。  相似文献   

2.
网络上带有人的主观感情色彩的评论性文本反映了人们的意见、态度和立场,因而具有很大的利用价值.信息挖掘技术针对这些主观文本进行处理,获得有用的意见、结论和知识.首先介绍了意见挖掘出现的背景和应用意义,然后从词汇情感极性识别、粗粒度的情感分类、细粒度的意见挖掘与摘要、意见检索和相关语言资源与系统5个方面综述了研究历程和现状,最后总结了研究难点与研究趋势.  相似文献   

3.
存在于网上商城的大量的产品评论数量在以惊人的速度增长,并成为文本挖掘研究的一个新兴热点.由于中英文语言本身的不同,我们需要将汉语评论意见挖掘作为一个单独的领域来研究.在前人研究的基础上介绍了一种新的情感分类方法,第一次提出了将主观性意见语句分为以下三类:强极性主观性意见语句,依赖上下文语境的弱极性主观性意见语句,第三类...  相似文献   

4.
在分析维吾尔语词性规则和语法特征的基础上,以维吾尔语评论性语句为研究语料,提出了一种基于Bootstrapping算法的意见挖掘关系抽取方法.在每一次迭代过程中,根据改进的评分公式选取最优模式抽取主题词-意见词对;迭代结束后,对于主题-意见词对为空的评论语句,使用最近匹配算法抽取主题-意见词对;用并联模式和否定模式对抽取的主题-意见词对进行扩展和修正.关系抽取的最终目标是为每一个评论性语句建立一个或多个二元组<主题词,意见词>,并使主题词和意见词一一对应.实验结果表明了该方法在关系抽取上的有效性.  相似文献   

5.
随着移动互联网的快速发展,用户逐渐成为社交媒体的主导者,新媒体的迅速崛起,改变了传统的信息传播的格局以及规律,经典的大众传播理论中的意见领袖、把关人等有了新的时代意义,在一定程度上得到进一步的扩展和延伸。在现有的意见领袖的挖掘中主要是从网络结构和用户行为研究方向,没有考虑到是否真正对用户产生影响这一重要的属性,本文以符号网络作为研究工具,通过赋予用户之间的观点关系链接相应的代表支持或者反对的符号,将传统的意见领袖挖掘算法结合符号网络中的能够描述用户观点变化的符号关系,将真正对用户产生影响的意见领袖挖掘出来,从而挖掘得出更加精准有效地意见领袖。  相似文献   

6.
面向产品评论的意见挖掘研究综述   总被引:2,自引:0,他引:2  
近年来,随着电子商务的快速发展,面向产品评论的意见挖掘研究受到国内外学者的广泛关注,成为学术界的研究热点之一.对产品评论进行意见挖掘,不仅能为用户购物提供决策支持,还可以帮助生产商对产品和服务进行改进,具有重要的研究意义.对面向产品评论的意见挖掘的研究现状进行归纳和总结.首先将该问题分为3个子任务:意见信息抽取、情感分析,意见归纳.然后基于国内外的研究进展对它们进行详细的介绍和分析.并讨论该领域其他一些值得关注的问题.  相似文献   

7.
近年来,随着旅游类互联网产品的兴起,网络上产生了大量针对目的景点的主观评论,使用深度学习算法对相关评论进行意见挖掘,帮助游客快速了解景区特点并为旅游监管提供依据,已然成为一个新的趋势.如何将细粒度意见挖掘方法,如方面级情感分析,应用到旅游评论中,成为一个迫切需要解决的问题.针对上述问题,结合方面级情感分析中意见词抽取和...  相似文献   

8.
目的 登革热是一个全球性公共卫生问题,从地理学时空数据分析的视角,探究登革热的时空特质、构建登革热时空过程模型,是有效预防、控制登革热的新方法、研究新热点。方法 基于时空数据挖掘、时空过程建模,综合环境、气象、地理、人口4大因素,分析登革热的空间相关性及登革热病例的空间自相关,挖掘登革热影响因子;针对BP(back propagation)神经网络模型易陷入局部最优的缺陷,引入遗传算法(GA)改进BP神经网络模型,用于登革热时空模拟。结果 登革热的时空扩散与温度、湿度、居民地、交通、人口密度呈显著相关;登革热病例之间呈显著自相关;登革热发生、扩散与环境、气象、地理、人口中的多种因子存在非线性关系;利用改进的GA-BP神经网络模型模拟登革热时空扩散,均方根误差达到0.081。结论 登革热发生、扩散是由多种因素综合影响的结果;GA-BP神经网络模型能够有效模拟登革热时空过程;此模型同样适用于其他伊蚊类传染病的模拟。  相似文献   

9.
针对片段评论文本信息琐碎、片段出现的特点,将文本分类技术应用在对片段评论文本进行分类的研究上,采用了基于主题特征和句子结构的片段文本倾向分类技术。最后,对片段评论文本意见信息进行了倾向性分类实验,并尝试对意见摘要的研究。  相似文献   

10.
细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示并将其加入序列标注模型的输入部分。首先构建一份新的电商领域情感词典,然后在电商评论文本真实数据上,分别为条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)这两种常用序列标注模型设计基于领域情感词典的特征表示。实验结果表明,基于电商领域情感词典的特征表示方法在两种模型上都取得了良好的效果,并且超过其他情感词典。  相似文献   

11.
如何从海量文本中自动提取有价值的观点信息已成为重要的技术挑战,当下的观点挖掘方法大多数是在假设主题相互独立的前提下进行的,但实际上主题与主题之间有着复杂的内在联系。为解决以上问题,在CTM模型的基础上提出了基于主题情感混合的主题相关模型,在考虑到主题相关性的同时,还分析了对应主题下的观点特征以及潜藏的情感倾向,更为精确地获取了文档主题的情感极性,仿真实验验证了本模型的有效性,并使用R语言进行了可视化实验分析。  相似文献   

12.
互联网已经逐渐成为散户投资者获得投资信息的主要渠道.“大盘走势”是散户投资股市主要考虑的因素.这里基于股评文章的特征设计实现了股评观点挖掘系统.该系统利用基于模式的倾向性分析股评的方法,识别并提取预测性观点句并通过倾向性分析最终获得股评的分类.实验表明,基于该方法的观点挖掘系统,查准率达到了91.7%.  相似文献   

13.
是指从与司法案件相关的舆情信息中抽取与案件相关的句子作为摘要。在案件舆情文本中通常包含如涉案人员、案发地点等案件要素,这些案件要素对于摘要生成有着重要的指导意义。因此,针对案件舆情文本的特点,提出一种基于案件要素异构图的抽取式摘要模型。首先通过基于图注意力机制融入案件要素的方法,构建一个由句子节点、词节点和案件要素节点组成的异构图,来捕捉句子间的关联关系,最后对句子进行分类,生成摘要。在基于百度百科构建的案件舆情数据集上进行实验,结果表明,模型相比基于注意力机制融入案件要素的方法在ROUGE-L上取得14.22个百分点的提升。  相似文献   

14.
案件舆情摘要是从涉及特定案件的新闻文本簇中,抽取能够概括其主题信息的几个句子作为摘要.案件舆情摘要可以看作特定领域的多文档摘要,与一般的摘要任务相比,可以通过一些贯穿于整个文本簇的案件要素来表征其主题信息.在文本簇中,由于句子与句子之间存在关联关系,案件要素与句子亦存在着不同程度的关联关系,这些关联关系对摘要句的抽取有着重要的作用.提出了基于案件要素句子关联图卷积的案件文本摘要方法,采用图的结构来对多文本簇进行建模,句子作为主节点,词和案件要素作为辅助节点来增强句子之间的关联关系,利用多种特征计算不同节点间的关联关系.然后,使用图卷积神经网络学习句子关联图,并对句子进行分类得到候选摘要句.最后,通过去重和排序得到案件舆情摘要.在收集到的案件舆情摘要数据集上进行实验,结果表明:提出的方法相比基准模型取得了更好的效果,引入要素及句子关联图对案件多文档摘要有很好的效果.  相似文献   

15.
网络新媒体的快速发展,使得网上评论数据呈现爆炸性增长,面对数量庞大的网络文本,使用传统的人工方式来提取观点会导致效率低下、分类界限模糊、领域适应性差等问题。为解决以上问题,在对传统LDA模型进行改进的基础上,提出了一个基于领域判别的LDA主题模型来对在线评论进行观点挖掘。首先,在标准LDA模型中引入领域层,对语料库中的文档采样领域标签,利用领域化的参数来求解LDA模型;其次,考虑到句子间的情感从属关系,在主题层和单词层之间加入情感层,并引入情感转移变量进行表示,提高了情感极性分析的精度,实验结果表明了本文所提模型和理论的有效性。  相似文献   

16.
中文评价对象与评价词抽取是文本倾向性分析的重要问题.如何利用评价对象与评价词之间的语法、共现等关系设计模型是提高抽取精度的关键.本文提出了一种基于多层关系图模型的中文评价对象与评价词抽取方法.该方法首先利用词对齐模型抽取评价对象与评价词搭配;然后,考虑评价对象与评价词的依存句法关系、评价对象内部的共现关系和评价词内部的共现关系,建立多层情感关系图,接着利用随机游走方法计算候选评价对象与评价词的置信度;最后,选取置信度高的候选评价对象与评价词作为输出.实验结果表明,与现有的方法相比,本文所提出的方法不仅对评价对象和评价词的抽取精度均有显著提升,而且具有良好的鲁棒性.  相似文献   

17.
通过研究网络舆情传播的发展现状、趋势及特点,介绍了藏文网络舆情传播的特点和作用.根据复杂网络理论的研究方法对藏文网络舆情传播规律进行实证分析,设计了一个藏文网络舆情模型结构.研究表明,通过聚类可以提高藏文网络舆情的准确性,Web挖掘能够有效地从藏文网络上获取并分析相关舆情信息.  相似文献   

18.
该文在研究了信息检索理论与文本倾向性分析技术等的基础上,结合国内外关于观点检索的相关研究,提出了基于关联度的文本观点检索算法。它综合考虑了主题检索过程中的查询扩展、文本检索相关度、文本倾向性强度和检索主题与文本情感的关联度等对观点检索最后结果的影响。该算法从理论上考虑了观点检索不同因素之间的相互影响问题。通过对COAE2008观点检索子任务的实验数据进行实验,结果表明 该文提出的基于关联度的观点检索算法可以取得较好的效果。  相似文献   

19.
倾向性句子识别是文本倾向性分析的重要组成部分,其目的是识别文档中具有情感倾向的主观性句子。中文句子的倾向性不仅与倾向词有关,而且还跟句法、语义等因素有关,这使得倾向性句子识别不能简单地从词语的倾向性来统计得到。该文提出了一种基于N-gram超核的中文倾向性句子识别分类算法。该算法基于句子的句法、语义等特征构造N-gram超核函数,并采用基于该超核函数的支持向量机分类器识别中文倾向性句子。实验结果表明,与多项式核、N-gram核等单核函数相比,基于N-gram超核的中文倾向性句子识别算法在一定程度上能有效识别倾向性句子。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号