首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
以有效分析和挖掘网络产品评论中的用户观点从而为消费者和商家均提供有价值的信息为目的,提出了网络产品评论挖掘的步骤和方法,并在用户产品评论分析的基础上,进一步对产品特征词的关注度和极性进行分析,实现了更加全面地产品评论挖掘.最后以iphone 4s为例对所提出的方法进行了实验,验证了该方法的可行性.  相似文献   

2.
挖掘中文网络客户评论的产品特征及情感倾向*   总被引:17,自引:2,他引:15  
为探索中文客户评论中的产品特征及相关情感倾向的挖掘,以帮助生产商和服务商改进产品、改善服务,提高竞争力,提出采用基于Apriori算法的非监督型产品特征挖掘算法,结合监督型情感分析技术,实现对于评论中产品特征及其情感倾向的综合信息挖掘;并根据用户的关注权重将产品特征和情感倾向进行排列。采用几种从互联网下载的真实产品评论语料,对该方法进行了数据实验,实验结果初步验证了该方法的有效性。  相似文献   

3.
面向产品评论的意见挖掘研究综述   总被引:2,自引:0,他引:2  
近年来,随着电子商务的快速发展,面向产品评论的意见挖掘研究受到国内外学者的广泛关注,成为学术界的研究热点之一.对产品评论进行意见挖掘,不仅能为用户购物提供决策支持,还可以帮助生产商对产品和服务进行改进,具有重要的研究意义.对面向产品评论的意见挖掘的研究现状进行归纳和总结.首先将该问题分为3个子任务:意见信息抽取、情感分析,意见归纳.然后基于国内外的研究进展对它们进行详细的介绍和分析.并讨论该领域其他一些值得关注的问题.  相似文献   

4.
产品垃圾评论检测研究综述   总被引:2,自引:2,他引:2  
互联网上的产品垃圾评论混淆视听,误导了潜在消费者。产品垃圾评论检测的目的就是将垃圾评论从评论文本中找到并去除,保留真实的产品评论供用户参考。首先将产品垃圾评论和互联网上其它常见的垃圾信息进行了对比,并把产品垃圾评论的检测和产品评论的质量判断、产品评论的情感分析等相关的工作进行了比较分析。然后从产品垃圾评论检测的数据集、检测方法两个角度对相关工作做了概述和分析。最后,在上述工作的基础上提出了一些产品垃圾评论检测研究中值得进一步关注的问题。  相似文献   

5.
Web 2.0时代,消费者在在线购物、学习和娱乐时越来越多地依赖在线评论信息,而虚假的评论会误导消费者的决策,影响商家的真实信用,因此有效识别虚假评论具有重要意义.文中首先对虚假评论的范围进行了界定,并从虚假评论识别、形成动机、对消费者的影响以及治理策略4个方面归纳了虚假评论的研究内容,给出了虚假评论研究框架和一般识别...  相似文献   

6.
商品评论对消费者的购买意愿有明显导向作用,欺诈者可杜撰评论来过度褒奖或恶意贬低商品,以此来促进己方或是打击对方的商品销售,垃圾商品评论检测成为了一项迫切需要的技术。首先将相关研究分为以评论内部(文本特征)为中心和以评论外部(文本特征)为中心的两大类,然后分别综述它们在特征选择、学习方法上的研究进展,并介绍了垃圾商品评论检测领域的常用评论数据集,在此基础上,展望了该领域的热点研究方向。  相似文献   

7.
用户评论的质量检测与控制研究综述   总被引:1,自引:0,他引:1  
随着网络技术的发展,越来越多用户生成的内容(user-generated content)出现在网络应用中,其中,用户评论富含用户的观点,它们在网络环境中充当越来越重要的角色.据美国Cone公司2011年的调查报告,64%的用户在购买行为之前会参考已有的用户评论.因此,为用户提供准确、简洁和真实的评论是一个迫切且重要的任务.主要围绕评论质量评估、评论总结和垃圾评论检测这3个方面综述了国际上评论质量检测与控制的研究内容、技术和方法的研究进展.在此基础上,展望该领域的发展给出了可能的研究方向.  相似文献   

8.
目前产品评论挖掘问题主要分为以下四个任务:网络评论中产品特征词的挖掘;网络评论中用户观点词的挖掘;对评论观点词的极性判断和强度判断;对挖掘结果进行排名。目前国内外对评论挖掘的研究主要集中在前三个任务。  相似文献   

9.
设计一个Web系统,利用Android电子市场上各个领域的软件评论,对软件进行细致的评价,帮助用户选择适用的软件。首先通过抓取Google play评论建立数据库,利用规则模板提取软件特征和情感词。然后,通过知网与用户常用极性词典判别情感倾向。最后通过特征聚类等方式将软件之间特征级别进行对比与评价,从而把同类软件按特征粒度进行精准排序和选择。  相似文献   

10.
中文网络评论的IT产品特征挖掘及情感倾向分析   总被引:1,自引:0,他引:1  
为探索中文客户评论中的IT产品特征及相关情感倾向的挖掘,帮助IT生产商和服务商提高改进产品和服务质量,提高竞争力。该文将采用情感分析技术,提出基于客户感知价值的产品特征挖掘算法,实现对于评论中IT产品特征及其情感倾向的语义分析、动态提取和综合信息挖掘;并根据用户的关注权重将产品特征和情感倾向进行排列。采用从互联网下载的真实IT产品评论语料中进行实验,初步验证了该方法的有效性。  相似文献   

11.

由于图文结合更能反映用户的态度和立场,图文情感分析已成为研究热点之一. 然而,现有图文情感分析方法无法有效地提取融合图文信息,致使模型性能低、参数量大、不易部署. 对此,提出了一种基于公共情感特征压缩与融合的轻量级图文情感分析模型. 该模型结合卷积层和全连接层设计的图文特征压缩模块在提取图文特征的同时也进行了压缩,降低了特征维度. 此外,提出了一种基于门控机制的公共情感特征融合模块,将图文特征映射到相同的情感空间,消除了图文特征间的异构性,通过提取、融合图像和文本的公共情感特征,减少了冗余信息. 在Twitter,Flickr,Getty Images这3个基线数据集上的实验结果表明:所提模型比早期模型更有效地提取融合了图文情感信息;和最新模型相比,所提模型大大减少了模型参数并具有更优越的性能,更易部署.

  相似文献   

12.
以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特点,将无先验知识的模式挖掘问题转化为特定模式的匹配问题,提出了一种快速高效的频繁模式挖掘算法,来获取语义完整的维吾尔文词。实验结果表明,通过该算法获取的维吾尔文词,在结构上是稳定的,语义上是完整而独立的。  相似文献   

13.
汉语句子语义极性分析和观点抽取方法的研究   总被引:18,自引:0,他引:18  
娄德成  姚天昉 《计算机应用》2006,26(11):2622-2625
利用自然语言处理技术,对中文网络评论语句进行语义极性分析和观点抽取。提出了计算词语上下文极性的算法,并且分析主题和修饰成分的匹配关系。最后与手工标注结果进行比较,通过实验证明了该算法的合理性和有效性。  相似文献   

14.
空间co-location模式是一组空间特征的子集,它们的实例在邻域内频繁并置出现。通常,空间co-location模式挖掘方法假设空间实例相互独立,并采用空间实例参与到模式实例的频繁性(参与率)来度量空间特征在模式中的重要性,采用空间特征的最小参与率(参与度)来度量模式的有趣程度,忽略了空间特征间的某些重要关系。因此为了揭示空间特征间的主导关系而提出主导特征co-location模式。现有主导特征模式挖掘方法是基于传统频繁模式及其团实例模型进行挖掘,然而,团实例模型可能会忽略非团的空间特征间的主导关系。因此,基于星型实例模型,研究空间亚频繁co-location模式的主导特征挖掘,以更好地揭示空间特征间的主导关系,挖掘更有价值的主导特征模式。首先,定义了两个度量特征主导性的指标;其次,设计了有效的主导特征co-location模式挖掘算法;最后,在合成数据集和真实数据集上通过大量实验验证了所提算法的有效性以及主导特征模式的实用性。  相似文献   

15.
手掌静脉图像识别技术综述   总被引:2,自引:0,他引:2       下载免费PDF全文
人体的手掌静脉具有唯一性、稳定性,隐藏在表皮下,结构复杂很难被复制,手掌静脉图像难以窃取拍摄,这些使得手掌静脉成为一种高安全性的生物特征。作为生物特征识别领域的前沿课题,手掌静脉图像识别技术以其高安全性等优势拥有着广泛的应用前景,成为近几年的研究热点。本文从手掌静脉图像识别技术的原理入手,综述了手掌静脉图像识别的四个阶段:图像采集,图像预处理、特征提取及匹配。根据特征提取方法不同,将掌脉图像识别方法分为基于结构特征的方法、基于纹理特征的方法和基于子空间的三类方法。最后,对掌脉图像识别技术的难点进行了总结,对发展趋势进行了展望。  相似文献   

16.
特征模型已经成为软件产品线工程中共性/可变性建模的事实标准.现有基于特征图的建模工具由于在模型表达能力、严谨的形式化语义等方面的不足限制了其在工业界的应用.为了消除这些建模中的缺陷,为基于特征的产品线开发提供一个坚实的支撑环境,提出文本式特征建模语言TEFL,介绍其具体语法、抽象语法,以及形式化语义;开发一个基于Eclipse的语言编辑器原型;给出了面向XML和Java语言应用转化方法和工具;分析了与现有文本式建模技术相比所具有的优势与不足,并指出在特征建模及其工具技术方面的进一步的工作方向.  相似文献   

17.
不同于传统的词项间强独立性假设的词袋模型驱动的观点句识别方法,该文提出了一种新型的基于词项共现关系的图模型方法。该方法通过构建词项共现关系图模型,利用词项与词项之间的共现性和句法关系来描述词项在观点句和非观点句集合中的分布差异,同时采用基于入度的词项权重计算方法来计算词项特征值。上述研究在基准语料上进行实验,实验表明采用基于词项关系图模型方法后,中文观点句识别准确率相比目前基于词袋的方法得到显著提升。
  相似文献   

18.
Sequential pattern mining is an important data mining problem with broad applications. However,it is also a challenging problem since the mining may have to generate or examine a combinatorially explosivenumber of intermediate subsequences. Recent studies have developed two major classes of sequential patternmining methods: (1) a candidate generation-and-test approach, represented by (i) GSP, a horizontal format-basedsequential pattern mining method, and (ii) SPADE, a vertical format-based method; and (2) a pattern-growthmethod, represented by PrefixSpan and its further extensions, such as gSpan for mining structured patterns. In this study, we perform a systematic introduction and presentation of the pattern-growth methodologyand study its principles and extensions. We first introduce two interesting pattern-growth algorithms, FreeSpanand PrefixSpan, for efficient sequential pattern mining. Then we introduce gSpan for mining structured patternsusing the same methodology. Their relative performance in l  相似文献   

19.
论文以酒店在线评论数据为研究对象,对酒店在线评论数据的特征挖掘进行了研究。论文首先从酒店在线评论数据的获取出发,经过数据清洗、词性分析、特征抽取、指标确定、特征筛选、特征确定、特征校验几个环节,实现了酒店在线评论数据特征挖掘的目的。论文以词频为基础,融合了词性分析、聚类分析等方法,利用词频数(TF)、词频率(TF1)、词频权重(TTW)、评论频率(DF)、逆文档频率(IDF)和TF1-IDF等指标对候选特征词进行降维,得出酒店在线评论数据的特征,并对特征词进行校验,完成了酒店在线评论数据的特征挖掘的过程。论文将为以评论为依据的客户分类、酒店分类、智能推荐奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号