首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
在社交网络数据中,幂率分布是数据的基本规律,幂率分布的长尾部分数据有明显的稀疏性,长尾推荐一直是推荐系统的挑战,而冷启动、数据稀疏和覆盖率这些问题也是推荐系统的重要研究内容。通过分析数据幂律分布的特性,在研究社交网络个性化推荐方法的基础上,结合社交网络用户行为数据反映出来的幂律分布特性,通过极大似然估计数据幂律分布的标度值。结合幂率特性改进了相似度计算方法,提出了一种基于幂率特性的混合推荐方法 PowerLawCF。最后,使用新浪微博的用户签到数据进行对比分析,PowerLawCF算法的推荐效果有显著提升,提高了长尾推荐的效果,对推荐系统的数据稀疏性和冷启动问题解决效果较好,说明基于幂律分布特征的推荐方法在推荐系统中的应用有积极的效果。  相似文献   

2.
根据新浪微博的实际用户数据,发现粉丝数、关注数和微博数3个特征量的分布,都存在双段幂律分布现象,不同类型用户特征量的分布具有差异性.使用双帕累托对数正态(DPLN)分布对数据进行拟合,相比对数正态分布和幂律分布,可以得到更优的效果.用户活跃时间服从指数分布,不同活跃时间的3个用户特征量都近似服从对数正态分布;用户特征量的增长率服从对数正态分布,且与特征量自身的规模无关,这些特征与双帕累托对数正态分布模型一致,从而使用这一模型可以很好地解释粉丝数、关注数和微博数分布特性的形成机制.  相似文献   

3.
社交网络特征和用户关系是社交网络分析研究的重要内容。该文对移动社交网络中存在的幂律分布及用户亲属关系判别问题进行研究。在幂律分布的研究中,该文在度、连通子图规模及用户联系人数量的分布中找出存在的三个幂律分布,同时分析其中规律和结论,并与其他社交网络进行对比。在该文亲属关系判别研究中,通过提取用户通话行为的多种显著特征,采用GBDT(gradient boost decision tree)与LR (logistic regression)融合方法,提出一种用户亲属关系判别模型,并通过实验验证该模型能有效判别出用户间是否存在亲属关系,判别精确率达到81.01%。  相似文献   

4.
社交网络的影响力与其自身的结构特征密切相关。基于新浪微博的数据,对用户的粉丝数、关注数的分布及这些特征之间的关系进行分析,发现用户的粉丝数、关注数、微博数都符合幂律分布;探讨了节点之间的距离特征,发现并证明了微博网络中存在着“小世界”现象;研究了节点之间的链接形成问题,发现链接的形成满足三元闭包原理。以上三方面研究结果,对于探索微博影响力同底层社交网络结构特征的关系、设计微博影响力控制机制具有重要的意义。  相似文献   

5.
微博网络测量研究   总被引:9,自引:0,他引:9  
随着移动通信和Web技术的不断突破,以微博为代表的在线社会网络在中国广泛发展起来,越来越多的人开始使用微博进行信息分发和舆论传播.为了了解中国微博网络中的拓扑结构特征和用户行为特征等内在信息,对国内最大的微博系统——新浪微博——开展了主动测量,并结合已有的在线社会网络测量结果,对新浪微博的网络拓扑和用户行为特征进行了分析和比较.主要发现包括:1)新浪微博网络具有小世界特性;2)新浪微博网络的入度分布属于幂次分布,而出度分布表现为某种分段幂率函数;3)与类似社会网络相比,新浪微博网络的出入度不具有相关性;4)新浪微博网络属于同配网络;5)新浪微博用户发博时间具有明显的日分布和周分布模式;6)新浪微博用户博文数目分布表现为威布尔分布;7)新浪微博用户博文的转发和评价行为具有很强的相关性,且博文转发概率要高于评价概率.这些测量研究和发现不仅有助于设计出符合中国微博网络结构特征的数学模型和计算模型,也是实现对微博舆论的监测、引导、控制等方面的重要依据和基础.  相似文献   

6.
傅颖斌  陈羽中 《计算机科学》2014,41(2):201-205,244
随着以微博为代表的在线社交网站的发展,微博用户之间形成了复杂的社会网络。针对微博社会网络,研究了影响微博用户之间关系形成的各种因素,提出了基于链路预测的微博用户关系分析模型。首先分析了网络结构特征在微博社会网络中的作用,同时针对微博社会网络的特点,引入微博属性特征,构造基于随机森林的链路预测模型,并将模型应用于新浪微博用户数据集,进行微博用户关系的训练预测,通过比较引入微博属性特征前后的预测性能以及特征的重要性分布,分析了各类特征对微博用户关系形成的影响,揭示了除传统的网络结构特征外,微博属性特征对微博用户关系的形成具有重要的影响力。  相似文献   

7.
为了对新浪微博用户的异常情绪进行检测和分析,该文提出一种基于多元高斯模型和幂律分布的异常检测方法,根据联合概率密度值判断用户是否出现情绪异常。在实验部分,按照不同用户的异常检测准确率为83.49%,按照不同月份为87.84%。分布测试表明,单个用户的中性、快乐和悲伤情绪服从正态分布,而惊讶和愤怒情绪则不服从;群体发布的微博的情绪服从“幂律分布”,而单个用户则不服从。该文引入多元高斯模型来进行社交媒体的异常情绪的检测,通过联合概率密度值量化了异常情绪检测。当数据充足时,该方法可以检测用户或者某个社交平台每一周甚至每一天的异常情绪,这对个体异常情绪检测、网络舆情挖掘、大规模爆发事件预防以及公共安全监测有一定意义。  相似文献   

8.
网络是一个包含了大量个体及个体之间相互作用的系统,近年来在对复杂网络的研究过程中,科学家们发现了众多的幂律分布现象。不仅网页的点击次数存在幂律分布现象,微博也同样存在着幂律分布现象。利用新浪微博的API技术抓取了新浪微博数据,对其进行了详细的数据清理和统计,对统计结果进行分析发现,新浪微博的转发数也同样存在着幂律分布现象。只有为数不多的微博,才能被大量的阅读和转发,进而成为热点微博,而绝大多数微博的阅读次数和转发次数都是非常少的。  相似文献   

9.
实证研究表明,绝大多数复杂网络的结点的度分布服从幂律分布,该幂律分布的幂指数的绝对值(度分布指数)介于2和3之间.然而,至今尚未发现为什么度分布指数介于2和3之间的研究结果.本文证明了度分布指数大于2,从而部分回答了上述问题.为此,本文引进度秩指数,并给出了度秩指数和度分布指数之间的关系.通过对度秩指数与网络结构熵之间的关系的刻画,发现了度秩指数与网络结构熵以及网络规模之间的函数依赖关系,从而最终证明了度秩指数的临界值趋于1,并给出了仿真结果.  相似文献   

10.
基于BBV的有向加权网络模型   总被引:1,自引:0,他引:1       下载免费PDF全文
王桂英  周健  谢飏 《计算机工程》2010,36(12):141-143
在BBV模型基础上,结合方向性和网络演化特性,提出一种有向加权网络模型。引入参数p、q,将节点强度分为入强度和出强度,根据BBV建模思想进行模型择优和演化。理论分析和数值模拟仿真结果表明,该模型的节点出入强度和出入度分布满足幂律指数为[2,3]的幂律分布,且通过调节参数可使平均路径和聚簇系数符合复杂网络特性。  相似文献   

11.
陈骁  黄曙光  秦李 《计算机应用》2015,35(3):638-642
探究微博转发网络的构建机制有助于深刻理解信息在微博平台上的传播过程,得出针对微博营销、舆论管控的有效策略和建议。针对这一问题,提出了一种有向加权网络模型。根据微博在转发过程中被多次转发的现象,在模型建立过程中,在节点间连边时引入三角连接机制,并且用连边的方向选择表征了活跃用户和知名用户的不同行为特征,同时考虑了权值的动态演化过程。理论分析和仿真实验表明模型的强度分布、度分布、强度-度的相关性均服从幂律分布,幂指数为1~3,而且具有高聚类、短路径的特点,平均聚类系数可达0.42,平均路径长不超过6,同时采集了微博转发的实际数据验证了模型的正确性。  相似文献   

12.
社会化标签系统允许用户使用个性化的词汇对网络中的资源进行标注而被用户广泛接受。在微博网络中,用户可以为自己加注标签以推广自己或者方便别人找到自己。深入分析了微博用户数据,总结了微博用户标签的特点,针对LDA(latent Dirichlet allocation)主题模型在处理短文本时存在的不足,提出了一种基于好友关系约束主题模型。在此基础上对微博用户标签进行主题分析,计算用户的主题分布,对标签词进行聚类,并最终为用户推荐标签。通过对比实验证明了该方法可以提高标签推荐的准确度。  相似文献   

13.
基于兴趣的科研合作网络演化模型   总被引:1,自引:0,他引:1       下载免费PDF全文
从科研合作网络的研究现状入手在BA网络模型的基础上,基于科研工作者研究兴趣,给出了一个新的科研合作网络的数学模型,并建立了一个基于兴趣相似度的符合科研合作网络真实特性的网络演化模型。初步的仿真实验结果表明,按照该模型构造出来的网络度分布服从幂指数为-3的幂律分布。  相似文献   

14.
首先采用物质流动算法进行二部图相似系数投影,然后利用随机游走模型得到协同过滤结果。在计算相似系数时,采用了考虑用户和项目联合度分布特征的改进算法。通过数据模拟可知,在最优情况下推荐项目准确率提高了18. 19%,推荐项目多样性提高了21. 90%。对用户和项目联合度的分布进行了统计分析,结果表明,在最优情况下,其符合指数为--2. 33的指数分布。  相似文献   

15.
为揭示以制造商为核心的供应链网络演化规律,以BA模型和多级局域世界理论为基础,结合现实网络中节点生成与退出机制,提出了一种五级局域世界网络模型。首先,研究了以制造商为核心的供应链网络的内在特性和演化机制;其次,分析了网络的拓扑结构和演化规则,建立了仿真模型;最后,仿真分析了不同时间步以及不同临界条件下节点数量、集聚系数、度分布等网络特性参数的变化,推导出网络的演化规律。仿真结果表明:以制造商为核心的供应链网络具有无标度、高集聚性;随着时间的推进以及节点增长速度的增加,网络整体的度分布趋近于指数为3的幂律分布;网络内各级局域世界的度分布不同,二级供应商、零售商的度服从幂律分布,一级供应商和分销商的度服从指数分布,制造商的度大致服从泊松分布。  相似文献   

16.
微博空间存在大量的广告内容,这些信息严重影响着普通用户的用户体验和相关的研究工作。现有研究多使用支持向量机(SVM)或随机森林等分类算法对广告微博进行处理,然而分类方法中人工标注大数据量训练集存在困难,因此提出基于聚类分析的微博广告发布者识别方法:对于用户维度,针对微博广告发布者通过发布大量普通微博来稀释其广告内容的现象,提出核心微博的概念,通过提取核心微博主题及其对应的微博序列,计算用户特征和对应微博的文本特征,并使用聚类算法对特征进行聚类,从而识别微博广告发布者。实验结果显示,所提方法准确率为92%,召回率为97%,F值为95%,证明所提方法在广告内容被人为稀释的情况下能准确地识别微博广告发布者,可以为微博垃圾信息识别、清理等工作提供理论支持和实用方法。  相似文献   

17.
从现实世界网络中存在的局域性质及联系强弱角度出发, 研究一种新颖加权多局域世界网络模型(WDLW)。该模型算法结合权重分析动力学及局域世界性质, 能实现动态演化。均场理论及数值模拟仿真均验证了该模型强度分布具有幂率性; 实证数据检验了WDLW模型与Internet网络在拓扑结构和模块度上是吻合的。由此可得出结论, WDLW模型的强度分布呈现显著的幂率特性, 并且能很好地模拟现实中的Internet网络。  相似文献   

18.
移动社会网络数据存在网络结构复杂,节点间标签相互影响,包含交互信息、位置信息等多种复杂信息等特点,给识别用户的特征带来了许多挑战。针对这些挑战,通过分析一个真实的移动网络数据,利用统计学分析提取出已标记的不同特征用户间的差异,并利用这些差异,借助关系马尔可夫网络建立预测模型对未标记用户的年龄与性别进行特征识别。分析表明,不同年龄、性别的用户在不同时段的通话概率、通话熵,位置信息的分布、离散性,在社会网络中的集聚程度,以及相互之间二元、三元的交互频率方面都存在明显的差异。利用这些特征,提出了利用二元和三元交互的关系基团模板,结合用户自身的时间空间特征,通过关系马尔可夫网络计算用户特征的全联合分布概率,进而以此推断用户的年龄与性别的方法。经过实验分析,利用关系马尔可夫网络、用户时空信息和用户交互的关系基团的分类方法相较于传统的C4.5决策树、随机森林、Logistic回归和Naive Bayes等分类方法,能够提高最高约8%的预测准确率。  相似文献   

19.
当前的影响力分析算法大多基于网络拓扑结构或用户交互信息,然而单一方面的方法会使挖掘结果出现较大的偏差,目前缺乏全面准确的影响力挖掘方法。本文通过对传统PageRank算法进行扩展,提出一种面向新浪微博的基于用户交互度连接属性的TCRank算法;其次设计了3种微博意见领袖特征指标,并对其加权求和用于意见领袖候选集的精化操作;同时提出一种基于卷积神经网络模型的情感支持度的意见领袖抽取算法,对意见领袖候选集进行最终排名。最后,通过实验验证所提出算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号