首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
方面级意见挖掘的任务通常包括从客户评论中抽取产品的特征、与产品特征相关联的观点词识别以及观点的极性判断三个方面。围绕如何实现中文评论的方面级意见挖掘问题,提出了利用条件随机场实现中文评论的方面级意见挖掘的四个主要步骤:数据预处理、训练集准备、为条件随机场模型定义学习函数、应用模型标注新的评论数据。在此基础上,通过以五种实际产品的中文评论语料为数据集,对该方法进行了数据实验。实验结果表明,该方法针对不同类型观点元素的抽取在评估性能指标上大部分达到或超过80%。为了进一步验证所提出方法的有效性,将研究结果进行了差异显著性检验。结果显示,用CRF对中文评论进行方面级意见挖掘和对英文评论的方面意见挖掘的性能差异不大。最后,比较了三种不同方法的方面抽取精度和情感分类精度,实验结果表明,CRF方法优于词典化的隐马尔可夫模型和关联规则挖掘方法。  相似文献   

2.
产品特征的层次关系获取   总被引:2,自引:0,他引:2       下载免费PDF全文
产品评论挖掘用来对用户发表到网络上的众多评论内容进行信息提取,从而获得用户对产品的部件或功能的褒贬评价。现有的产品评论挖掘研究中没有对上下位的特征、同一特征的不同词语表达进行处理。首先对厂家规格说明文档的结构化表示进行挖掘获得厂家规格特征及其关系,再使用Bootstrapping弱监督方法从网站编辑评测文章中抽取出用户的描述特征及与规格特征之间的层次关系。应用该方法在手机领域的产品特征关系进行了抽取,实验结果显示获得的产品特征之间的层次关系很好的效果。  相似文献   

3.
基于多标记学习的汽车评论文本多性能识别   总被引:1,自引:0,他引:1  
针对汽车产品评论文本中出现的多方面性能,提出一种基于多标记学习的汽车评论文本多方面性能识别方法。首先,结合文本挖掘方法,利用多标记文本特征选择方法选取特征,将非结构化的文本转化为结构化的多标记数据集。在此基础上,使用四种多标记分类方法,对待识别的评论文档标注一个或多个方面标记。最后,以八种多标记评价指标评估方面识别的性能。在新浪汽车评论语料上的实验表明,方面识别的子集准确率达到了95%,验证了方法的可行性。  相似文献   

4.
产品评论挖掘研究综述   总被引:6,自引:0,他引:6       下载免费PDF全文
产品评论挖掘是以Web上用户发表的产品评论为挖掘对象,采用自然语言处理技术,从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。产品评论挖掘是一个新兴的研究领域,是对自然语言描述的无结构数据进行数据挖掘的典型代表。产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品,还可以帮助用户合理的购买产品。对产品评论挖掘进行了全面深入地讨论,介绍了产品评论挖掘系统的通用框架,然后对产品特征提取、主观句定位、用户态度提取、态度极性判定、挖掘结果显示这5个子任务进行了详细地阐述,最后介绍了产品评论挖掘的最新方向。  相似文献   

5.
《计算机科学与探索》2016,(10):1429-1438
传统的推荐算法大都从评论中挖掘用户兴趣或产品特征,然而由于评论形式自由,规则性差,导致从评论中获取有效信息较困难,推荐结果不理想。在电子商务等领域,评论标签作为一种新的评论方式已经被广泛使用。与评论相比,评论标签具有规则性强,信息密度大等特点,因此提出了一种融合评论标签的推荐算法。该算法从评论标签中挖掘用户对产品特征的观点,并利用其构建用户兴趣模型和产品特征模型,然后向用户推荐在他们感兴趣的特征上有较高评价的产品。与传统推荐算法进行对比,实验结果表明,融合评论标签的算法能有效地提高用户的覆盖率,并提升推荐算法的准确性。  相似文献   

6.
目前产品评论挖掘问题主要分为以下四个任务:网络评论中产品特征词的挖掘;网络评论中用户观点词的挖掘;对评论观点词的极性判断和强度判断;对挖掘结果进行排名。目前国内外对评论挖掘的研究主要集中在前三个任务。  相似文献   

7.
网络评论方面级观点挖掘方法研究综述   总被引:2,自引:0,他引:2  
网络评论的观点挖掘任务是文本分析的关键问题之一.随着网络评论的快速增长,用户在浏览评论时更加关注细粒度的信息,因此对评论进行方面级观点挖掘能够帮助消费者更好地做出决策.过去的十多年间,研究人员在大量网络评论语料库上进行观点挖掘等相关研究,并取得了丰硕的研究成果和广泛的应用价值,更不乏优秀学者对观点挖掘方法现状进行综述总结.然而有针对性地对观点挖掘中方面提取与观点提取进行综述总结的成果较少.本文综述了近年来网络评论方面级观点挖掘的研究现状.首先介绍了方面级观点挖掘的相关问题描述;接着重点分类介绍方面提取方法及观点内容提取的主要方法;然后总结了方面级观点挖掘的常见评价指标以及在社会中的广泛应用价值;最后根据对现有方法提出挑战方向并进行系统总结.对方面级观点挖掘进行综述有助于比较不同方法的差异,从而发现有价值的研究方向.  相似文献   

8.
从大量的产品评论中进行观点评价对象的自动抽取是观点挖掘研究的重要课题,然而目前观点评价对象抽取结果只提供少量信息,因此提出一种基于上下文相关的双向自举方法同时获取产品名称和产品属性。该方法利用初始种子集、词性模板集获得候选观点评价对象,采用上下文相关的方法对文中所有包含候选观点评价对象的语句抽取出观点评价对象并进行边界识别,同时抽取观点评价对象的词性模板并计算分数,将分值高的模板加入模板集,这样重复迭代直到没有出现新的观点评价对象为止。实验结果表明采用上下文相关方法进行观点评价对象抽取相对于上下文无关的方法性能提高10%以上。  相似文献   

9.
探索产品特征,以帮助生产商和服务商有针对性地改进产品性能和指导用户对产品的各个性能有比较全面的了解。通过分析产品信息和评论信息,搭建3层挖掘模型实现基于观点挖掘的产品特征提取,第3层挖掘模型创新性地使用关联规则和依存分析相结合的方法。采用网络爬虫技术从互联网获取实验数据,实验结果证明该模型和该方法的有效性。  相似文献   

10.
通过利用大数据爬虫技术在电商网店中爬取某个商品的好评或差评大数据后,预处理爬取的评论使非结构化的数据去掉重复数据和无效数据,对处理后的数据进行分词、词性标注,去标点符号、去停用词处理,把非结构化数据转变为结构化数据,对评论数据采用算法构建模型并分析。采用基于决策树情感分析、情感词库分析、LDA模型的主题分析,综合3种方法对评论数据进行处理,得到一份最终的情感分析,从而得到消费者偏好的产品方向,以便商家能够获取进一步提升的方法。  相似文献   

11.
针对在电子商务平台上普遍存在的网络水军,提出了一个综合考虑网络结构与时间特征的算法来检测评论网络中的水军群组.该算法由四步组成:a)基于评论网络结构特征的分析挖掘出易受水军攻击的目标产品;b)受"共爆发现象"的启发,提出了一个目标产品被水军群组攻击的可疑时期挖掘算法;c)基于目标产品可疑时期内的数据,构造目标产品—评论者的诱导子图,并在该子图上应用层次凝聚聚类算法生成候选水军群组;d)为了过滤掉在可疑时期内购物并评论的正常用户,提出了一个水军群组净化方法,然后基于评论者的行为特征对净化后的群组进行分类.基于真实数据集的实验结果表明,该算法可以准确、高效地检测活跃在电子商务网站上的网络水军群组.  相似文献   

12.
移动互联网时代中,APP用户更注重产品体验,通过评论的方式来表达自己的使用情况和建议。在线评价数据的研究已经成为热点,从评论中获得的用户反馈有助于APP演化升级,但目前针对APP的评论挖掘方兴未艾。从9家APP应用商店中采集得到大量用户评论数据,筛选评论所包含的需求属性和情感倾向,并运用KANO模型对其建模分析,映射属性到魅力、期望、必备等类别。根据APP具体属性和所属KANO类别给出合理有效的更新演化策略:APP演化应优先满足必备和期望属性的需求,并逐步实现魅力属性的需求,并且最终检验了模型的鲁棒性和易移植性。  相似文献   

13.
为了克服传统问卷调查方法研究产品功能使用度时受限于样本大小和目标针对性不强等缺陷,提出了基于Web语义挖掘的产品功能使用度分析方法.运用基于人工修正的知网方法构建了关联词表,然后开发了产品使用信息系统,构建了产品功能定量化研究模型,对产品功能使用度进行分析.通过某款手机具体对该系统性的方法进行了验证,为产品功能决策提供...  相似文献   

14.
胡甜媛  姜瑛 《软件学报》2019,30(10):3168-3185
随着APP软件应用的普及,针对APP软件的用户评论数量急剧增加,基于用户评论挖掘有价值的软件使用反馈,可以帮助开发人员有针对性地维护和改进APP软件.针对不同类型的APP软件使用反馈,提出了评价对象和评价观点抽取规则,给出了评论模式和评论种子的定义;应用评论种子挖掘与之相同或相似的体现相同使用反馈类型的用户评论,基于人工标注的少量初始评论种子持续构建候选评论模式库;应用半监督自学习的方式,基于候选评论模式库动态扩充评论种子库;通过循环挖掘的方式,动态扩大挖掘体现不同使用反馈类型的APP软件用户评论的范围.实验结果表明,所提方法可以有效地挖掘体现使用反馈的APP软件用户评论,平均挖掘率达到77.82%.  相似文献   

15.
以词间空格作为自然分隔符,非常容易获取维吾尔文中的词,但又很难获取结构完整的语义词,因此多种文本处理效果总是很不理想。提出维吾尔文组词的新概念,将数据挖掘中的频繁模式挖掘方法引入到维吾尔文组词中,再结合维吾尔文的语言文字特点,将无先验知识的模式挖掘问题转化为特定模式的匹配问题,提出了一种快速高效的频繁模式挖掘算法,来获取语义完整的维吾尔文词。实验结果表明,通过该算法获取的维吾尔文词,在结构上是稳定的,语义上是完整而独立的。  相似文献   

16.
在对短文本进行情感分类任务的过程中,由于文本长度过短导致数据稀疏,降低了分类任务的准确率。针对这个问题,提出了一种基于潜在狄利克雷分布(LDA)与Self-Attention的短文本情感分类方法。使用LDA获得每个评论的主题词分布作为该条评论信息的扩展,将扩展信息和原评论文本一起输入到word2vec模型,进行词向量训练,使得该评论文本在高维向量空间实现同一主题的聚类,使用Self-Attention进行动态权重分配并进行分类。通过在谭松波酒店评论数据集上的实验表明,该算法与当前主流的短文本分类情感算法相比,有效地提高了分类性能。  相似文献   

17.
A large number of new words in product reviews generated by mobile terminals are valuable indicators of the privacy preferences of customers. By clustering these privacy preferences, sufficient information can be collected to characterize users and provide a data basis for the research issues of privacy protection. The widespread use of mobile clients shortens the string length of the comment corpus generated by product reviews, resulting in a high repetition rate. Therefore, the effective and accurate recognition of new words is a problem that requires an urgent solution. Hence, in this paper, we propose a method for discovering new words from product comments based on Mutual Information and improved Branch Entropy. Firstly, by calculating the Co-occurrence Frequency and Mutual Information between words and adjacent words, the character strings of words after pre-processing and word segmentation are expanded left and right respectively to discover the potential word set. The candidate set of new words is obtained by means of an improved support filtering algorithm. Finally, a new word set is built by applying an improved Branch Entropy filtering algorithm and removing old words. The experimental results show that this method can accurately and effectively identify new words in product comments.  相似文献   

18.
The selection and customization of usability evaluation methods, given the peculiarities of their application domains, still remains a critical issue; this especially when dealing with complex products and/or nonexpert usability evaluators. Moreover, as time goes by, the quality of the evaluation results has a heavier impact on the product design process. Starting from classic usability evaluation methods, the research described in this article generates multimethods semiautomatically. It allows quantitative characterization of these multimethods before their application in the field and exploits the comparison between this prior assessment and a final estimate, made after adoption, to update the information used by the method selection process. The most critical issue related to usability, subjectivity, is considered and dealt with throughout the entire research. A case study, done at the end of the development phase, helps validate the proposed approach to usability evaluation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号