首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对在电子商务平台上普遍存在的网络水军,提出了一个综合考虑网络结构与时间特征的算法来检测评论网络中的水军群组.该算法由四步组成:a)基于评论网络结构特征的分析挖掘出易受水军攻击的目标产品;b)受"共爆发现象"的启发,提出了一个目标产品被水军群组攻击的可疑时期挖掘算法;c)基于目标产品可疑时期内的数据,构造目标产品—评论者的诱导子图,并在该子图上应用层次凝聚聚类算法生成候选水军群组;d)为了过滤掉在可疑时期内购物并评论的正常用户,提出了一个水军群组净化方法,然后基于评论者的行为特征对净化后的群组进行分类.基于真实数据集的实验结果表明,该算法可以准确、高效地检测活跃在电子商务网站上的网络水军群组.  相似文献   

2.
某些卖方通过雇佣水军群组撰写虚假评论和评分等手段来影响或误导消费者的购买决策,而拥有造假间隔时间长、造假次数少、规模小等特殊造假特征的水军群组即游离水军群组,是难以识别的。为了检测游离水军群组,提出了一种基于时序邻居序列的游离水军群组检测方法。首先,通过时序网络建模评论者的共评论关系,并基于时序网络形成时序邻居序列;其次,基于时序邻居序列生成、合并和净化规则得到候选群组集合;最后,使用造假指标将候选群组分类排序,得到游离水军群组。基于两个真实数据集分别设计了三组实验来验证筛选高可疑度评论者可行性、在不同数据集上选择合适的阈值等。结果显示在两个真实数据集上本方法优于基线方法。  相似文献   

3.
在线评论对用户的购买决策有重要的影响作用,部分卖方为提高自身信誉或贬低竞争对手的产品,通过雇佣大量水军有组织、有策略地撰写虚假评论来误导潜在消费者。为了检测这种有组织的水军群组,提出了一个综合考虑网络结构与评论者的行为特征水军群组检测算法。首先,根据评分和评论时间相关性得到评论者之间的紧密度,构建评论者关系图;其次,基于构建的评论者关系图,利用标签传播方法检测社区,得到候选群组集合;最后,复原候选群组对应的二部图,以对比可疑度为评估指标,在每个二部图上找到最终的造假者。基于真实数据集的实验结果证明了该算法的有效性。  相似文献   

4.
在线评论对用户的购物决策有重要的影响作用,这导致一些不良商家雇佣大量水军有组织、有策略地给自己刷好评,以提高销量赚取更大利润,给竞争对手刷差评来抹黑对手,以降低其销量.为了检测这种有组织的水军群组,提出一种融合行为与结构特征推理的造假群组检测算法.该算法包含2部分:第1部分用频繁项挖掘方法产生候选群组,然后使用行为指标...  相似文献   

5.
为了从数据集更有效地检测出虚假评论群组.提出一种基于谱聚类的检测算法.对数据集中的多维数据样本进行分析,确定衡量用户之间相似程度的指标;利用用户相似度指标构造一幅以用户为节点、用户之间相似度为边上权值的带权评论者图;将该图的邻接矩阵作为相似度矩阵,利用谱聚类算法对其进行群组检测,将所有用户分为15个候选群组;对检测出的候选群组进一步挖掘,分析其内部特征.将不同方法检测得到的候选群组内部特征进行比较,结果表明该算法具有更高的有效性.  相似文献   

6.
张琪  纪淑娟  傅强  张纯金 《计算机应用》2019,39(6):1595-1600
针对在电子商务平台上检测编写虚假评论的水军群组的问题,提出了基于带权评论图的水军群组检测算法(WGSA)。首先,利用共评论特征构建带权评论图,权重由一系列群组造假指标计算得到;然后,为边权重设置阈值筛选可疑子图;最后,从图的社区结构出发,利用社区发现算法生成最终的水军群组。在Yelp大型数据集上的实验结果表明,与K均值聚类算法(KMeans)、基于密度的噪声应用空间聚类算法(DBscan)以及层次聚类算法相比WGSA算法的准确度更高,同时对检测到水军群组的特征与差异作了分析,发现水军群组的活跃度不同,危害也不同。其中,高活跃度群组危害最大,应重点关注。  相似文献   

7.
目前现有的低压配电网拓扑结构校验方法中,多是从高级量测体系(Advanced Metering Infrastructure,AMI)中获取待校验台区用户最近一段时间的电压序列数据,通过计算数据之间的相关系数来度量不同用户电压曲线之间的相似性。但是,用户是否属于同一台区的相关系数阈值难以确定,且现有的局部离群点检测(Local Outlier Factor,LOF)算法无法检测出离群组用户。因此,提出一种基于环域离群组检测(Ring Outliers Factor,ROF)的低压配电网拓扑校验算法,利用电压序列数据之间的相关系数作为ROF算法中的相关性度量,分析用户环域内的离群程度,从而校验出所属台区错误的用户组,可有效的验证电网GIS系统中用户与台区变压器拓扑连接关系的正确性。  相似文献   

8.
由于目前水军的高伪装性,经典的水军识别算法变得不再有效。与真实用户相同,水军用户之间也会形成一定的网络结构,提出了一种基于网络关系的方法来发现水军集团,首先以一个典型的水军账号作为种子,逐层扩展粉丝关系,优先搜索出现次数频繁的用户,从而获得一个包含大量水军账号的集合,按照水军用户之间关系的高度聚集性以及与真实用户之间关系稀疏性的特点,用Fast Unfolding算法进行社区检测。实验结果表明,该方法能够很好地发现水军集团。  相似文献   

9.
近年来,网格计算技术日益成为用来解决数据和计算密集型应用的可行方案,网格运行平台本身和在网格环境中的并行应用都需要大量的点对多点的群组通信.提出一种灵活、可容错的群组通信机制.该机制基于远程方法调用(RMI),可为分布式并行应用提供高效、可容错的群组通信.通信方法可以在本地对象、远程对象,或一组对象中激活.这种通信采用异步方式,通信发起者可以选择全等待或必要性等待两种机制来获取通信结果.从而最大程度地保证通信的可靠性或高效性.  相似文献   

10.
现有基于密度的聚类方法主要用于点数据的聚类,不适用于大规模轨迹数据。针对该问题,提出一种利用群组和密度的轨迹聚类算法。根据最小描述长度原则对轨迹进行分段预处理找出具有相似特征的子轨迹段,通过两次遍历轨迹数据集获取基于子轨迹段的群组集合,并采用群组搜索代替距离计算减少聚类过程中邻域对象集合搜索的计算量,最终结合群组和密度完成对轨迹数据集的聚类。在大西洋飓风轨迹数据集上的实验结果表明,与基于密度的TRACLUS轨迹聚类算法相比,该算法运行时间更短,聚类结果更准确,在小数据集和大数据集上的运行时间分别减少73.79%和84.19%,且运行时间的减幅随轨迹数据集规模的扩大而增加。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号