首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了提高商品虚假评论的识别效果,提出了一种基于习惯偏差与xgboost算法的虚假评论识别方法。首先,通过提出新的算法来计算情感极性,同时在位置因素的基础上加入本地化情感词,从而提高评论文本情感极性计算的精准度。然后,提出新的用户习惯偏差指标和商家异常波动区间值并将其与几维重要特征融合在一起,进而得到一个关于评论-评论者-商户三者特征的新模型。最后,再与xgboost算法进行结合完成虚假评论的检测。实验结果证明,其能更有效识别虚假的评论信息,为消费者提供更加安全有价值的参考信息。  相似文献   

2.
在线评论是用户判断商品质量的一个依据。虚假评论严重影响了消费者的购买行为,现有的虚假评论检测方法从文本出发,忽略了评分的虚假性,评分通常是不精确和不确定的,对虚假评论检测效果不佳。提出融合情感极性与信任函数的虚假评论检测方法(EP-BFRD),利用信任函数处理给定评论者评分中的不确定性和不准确性,考虑与其他评分者提供的评分的相似性,以检测误导性,并判断评论文本情感极性与评分一致性。综合考虑信任函数处理的结果以及评分与文本情感一致性的结果来判断评论的虚假性。在一个真实的数据库上进行实验,实验表明该方法可有效解决虚假评论检测问题。  相似文献   

3.
张璐 《计算机工程》2019,45(10):293-300
受经济利益驱使,大量恶意用户发布包含不实内容的虚假评论以影响用户的购买决策,从而提高自身商品的销售业绩并打压竞争对手,严重扰乱电子商务运营秩序。为此,介绍虚假评论识别的研究成果,包括虚假评论内容、发布者及虚假评论者群组的识别,对识别过程所使用的特征及检测方法进行对比分析,并给出虚假评论识别效果的评价方式和指标。在此基础上,对未来虚假评论识别研究工作进行探讨和展望。  相似文献   

4.
为了有效识别商品虚假评论,提出一种基于情感极性与SMOTE过采样的虚假评论识别方法。首先,根据在线虚假评论的特点,构建一个多维虚假评论特征模型。其次,在情感极性算法中增加了情感极性均值和情感极性标准差等统计指标来全面刻画虚假评论。最后,针对虚假评论中的类不平衡问题,使用SMOTE算法优化随机森林分类模型,从而提高虚假评论识别效果。基于大众点评网的真实评论数据进行了多组实验,实验结果表明该方法在正负样本不平衡的虚假评论数据集中具有更高的准确率、召回率及F值。综合考虑情感极性和正负样本不平衡等因素可帮助电商平台有效过滤虚假评论,为消费者提供更加真实可靠的评论数据。  相似文献   

5.
为解决虚假评论识别的问题,该文提出一种基于Markov逻辑网的虚假评论识别方法。首先,对虚假评论内容和评论者行为的特点进行分析,选取评论内容特征和评论者行为特征;然后,根据特征定义一阶逻辑谓词和逻辑公式,并介绍了权重学习和推理的过程;最后,进行了对比实验,结果表明该方法的虚假评论识别取得了较好的效果。
  相似文献   

6.
针对基于位置社交网络中的兴趣点推荐存在用户签到数据稀疏、评论文本信息利用不充分、推荐准确度不高等问题, 提出一种基于卷积神经网络的评论文本兴趣点推荐模型(RT-CNN). 首先采用高斯函数利用邻近地理位置加权方法填补矩阵分解模型中缺少的位置信息, 预测用户对未签到位置的潜在兴趣. 然后通过卷积神经网络处理评论文本信息挖掘潜在特征, 深度提取用户情感倾向, 使用Softmax逻辑回归函数获得评论文本与用户和位置兴趣点潜在特征相关的概率, 通过对目标函数的求解提取用户和位置潜在特征向量. 最后融合签到行为、地理位置影响、用户情感倾向、用户潜在特征和位置兴趣点潜在特征进行兴趣点推荐. 在公开的Foursquare网站纽约(NYC)和洛杉矶(LA)两个真实签到数据集进行实验, 结果表明RT-CNN模型相比其他先进的兴趣点推荐模型提高了精确率和召回率, 具有更好的推荐性能.  相似文献   

7.
随着电子商务的发展,识别网络中的虚假评论意义重大。传统的启发式策略或全监督学习算法不能有效地解决该问题。虚假评论与真实评论在语言结构和情感极性上存在差异,提出基于遗传算法对语言结构及情感极性特征进行优化选择,并利用选取的特征结合无监督硬、软聚类算法对虚假评论进行识别。实验结果验证了所提算法的有效性。  相似文献   

8.
随着互联网的发展,用户倾向于在购物、旅游、用餐之前参考线上评论.之后,他们也会发表评论来表达自身意见.线上评论越来越具有价值.评论对用户决策的重要导向作用催生了虚假评论.虚假评论,指用户由于利益、个人偏见等因素发布的不符合产品真实特性的评论.这些虚假评论语言上模仿真实评论,消费者很难识别出来.国内外学者综合运用自然语言处理技术来研究虚假评论检测问题.从特征工程的角度分析,虚假评论检测方法可以分为三类:基于语言特征和行为特征的方法、基于图结构的方法、基于表示学习的方法.主要描述了检测的一般流程,归纳了三类研究方法常用的特征,比较了方法的优缺点,并且介绍了研究常用的数据集.最后探讨了未来研究方向.  相似文献   

9.
针对虚假评论识别任务中传统离散模型难以捕捉到整个评论文本的全局语义信息的问题,提出了一种基于层次注意力机制的神经网络模型。首先,采用不同的神经网络模型对评论文本的篇章结构进行建模,探讨哪种神经网络模型能够获得最好的篇章表示;然后,基于用户视图和产品视图的两种注意力机制对评论文本进行建模,用户视图关注评论文本中用户的偏好,而产品视图关注评论文本中产品的特征;最后,将两个视图学习的评论表示拼接以作为预测虚假评论的最终表示。以准确率作为评估指标,在Yelp数据集上进行了实验。实验结果表明,所提出的层次注意力机制的神经网络模型表现最好,其准确率超出了传统离散模型和现有的神经网络基准模型1至4个百分点。  相似文献   

10.
商品评论信息是用户线上决策的重要依据,但在利益的驱使下商家往往会通过雇佣专业的写手撰写大量虚假评论的方式来误导用户,进而达到包装自己或诋毁竞争对手的 目的.这种现象会造成不正当的商业竞争和极差的用户体验.针对这一现象,我们通过情感预训练的方法对现有的虚假评论识别模型进行了改进,并提出了一种能够同时整合评论语义和情感信息的联合预训练学习方法.鉴于预训练模型强大的语义表示能力,在联合学习框架中采用了 2种预训练模型编码器分别用于抽取评论的语义和情感上下文特征,并通过联合训练的方法整合2种特征,最后使用Center Loss损失函数对模型进行优化.在多个公开数据集和多个不同任务上进行了验证实验,实验表明提出的联合模型在虚假评论检测与情感极性分析任务上都取得了 目前最好的效果且具有更强的泛化能力.  相似文献   

11.
GDI是MS-Windows的图形设备接口模块的简称,文中给出了GDI一些关键数据结构的分析结果,对目前流行的一些解释做了修正。  相似文献   

12.
Bivariate Pareto distributions arise naturally when it comes to comparing the performances of two systems. In this note, explicit expressions are derived for a relative measure of performance for every known bivariate Pareto distribution. The calculations involve the use of Gauss hypergeometric function.  相似文献   

13.
14.
针对评论中蕴含的商品特征数目繁多且同一特征具有多种不同描述的情况,提出一种基于语义相似度的商品特征聚类算法。算法包括"分配"和"转移"两个过程。"分配"过程对特征词进行聚类得到初始簇序列;"转移"过程依次遍历初始簇序列将簇内可能存在的与其他簇语义相似度更高的特征词转移到对应的簇。实验结果表明该算法聚类质量高、时间复杂度小且对数据输入次序不敏感。  相似文献   

15.
16.
17.
18.
在分析情感倾向分类的特点的基础上,提出一种基于直觉模糊推理的网页在线评论情感倾向分类方法。该方法通过样本库的学习将特征在分类时的不确定性分别用隶属度、非隶属度、犹豫度定量地描述,同时定量地考虑程度副词、转折词、否定词对表达情感的作用;然后通过对特征的直觉模糊信息的集结,按词组、句子、文本三个级别依次合成其情感倾向,得到文本的情感倾向。该方法在对公开语料库的测试中获得了很高的准确率和召回率。  相似文献   

19.
为了提供个性化推荐,推荐系统会将用户和物品分别表达为用户偏好向量和物品特征向量。物品特征向量中不同维度分别对应物品不同的特征。用户偏好向量中各维度表示用户对物品对应维度(特征)的喜好程度。目前大部分的推荐算法都假设为对于不同物品、同一用户的偏好向量是相同的。然而在现实生活中,该假设是不成立的。为此,提出一种结合注意力机制的深度学习模型,其能根据不同的用户-物品对,相应地学习到一个注意力权重向量,最终达到动态调整用户偏好向量的目的。在3组公开数据集上进行对比实验,以预测评分的均方误差(MSE)作为评估指标,实验结果表明该方法比已有的相关算法的效果更好。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号