共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
3.
《电子技术与软件工程》2017,(3)
微博转发是微博网络中信息得以传播的基础,对用户影响力评估以及网络营销等具有重要意义。现有的方法在考虑影响用户转发行为的因素时,大多只考虑微博以及用户属性等特征,没有考虑用户兴趣和用户历史行为规律等个性化特征,本文提出了基于LDA主题模型的用户兴趣与微博相似度计算方法,将计算结果作为用户兴趣特征,还提出了基于用户转发率、与上游用户交互频率的用户历史行为特征,最后融合用户兴趣特征、用户历史行为特征、上游用户特征、微博特征,建立基于几种常见分类模型的预测方法,在真实数据集上的实验结果表明,该方法能够有效提升预测准确性,取得较好的预测效果。 相似文献
4.
5.
微博作为“自媒体”时代的信息共享和交流工具,其传播价值日益显露。本文从实证角度出发,以“环球企业家杂志”账户的一条微博为样本数据,研究了微博信息传播范围逐层急剧增加、短时间快速衰减,微博用户因共同兴趣、爱好聚集的规律,探讨了有效利用微博进行信息传播的方法。 相似文献
6.
7.
针对为微博用户推荐符合其兴趣取向的个性化微博信息的问题,结合LDA主题模型,提出了一种基于用户动态兴趣和社交网络(DISN)的微博推荐方法.DISN方法首先引入时间函数,推断出用户的兴趣向量,通过对新发布的微博数据内容进行聚类分组,以用户兴趣向量筛选与用户最匹配的分组,随后以网格索引的形式对选定的分组中微博进行查询,计算微博发布者被目标用户关注的可能性并进行排序,最终形成推荐列表.实验验证了DISN方法较之传统方法更具有效性和高效性. 相似文献
8.
微博平台的兴起革新了人们的互动方式,给人们获取信息带来了极大便利.然而,在信息超载的环境下,人们需要花费大量的时间从许多冗余的微博信息中寻找自己感兴趣的信息,剔除无用信息.针对该问题,本文设计了一种新的方法对用户的微博信息进行过滤.该方法在传统方法基础上增加用户反馈环节;同时,考虑用户兴趣随时间变化的特点,在进行信息过滤时考虑时间对兴趣度的影响.该方法为微博信息个性化过滤提供了一种新思路. 相似文献
9.
10.
本文在综合兴趣模型研究现状的基础上,结合微博数据集对微博用户的特征进行分析,建立微博用户兴趣模型,并提出基于微博用户兴趣模型的发现算法。实验结果表明,本文提出的算法能很好的发现微博用户的兴趣,提高推荐系统的质量。 相似文献
11.
随着互联网飞速发展,微博等社交媒体也迅速成长起来,与此同时,微博平台上网络水军也越来越多。为了能够识别水军,还网络世界一个清净之地,本文针对Twitter平台,利用3个不同数据集以及Scikit-Learn库中3种分类算法进行实验,实验采用相关性检验方法比较不同特征集差异,得出提高分类效果准确率的有效特征,并通过不同机器学习算法训练数据集,得出最优算法。本实验在Twitter真实数据集下进行,实验结果表明“,推特用户收藏、回复、转发总数actions”特征的引入在很大程度上提高了分类效果准确率;并且相较于支持向量机与K最近邻算法,随机森林分类法能够更有效识别水军。 相似文献
12.
为有效处理并利用互联网海量的图像和视频数据,提出了一种基于Hadoop云平台的图像分类和标注解决方案。针对如何高效地进行训练集提取这一重要问题,搭建了基于云计算的图像抓取平台,利用互联网的图像资源作为原始数据集,为提取训练集图像提供足够的数据;实现了基于概率潜在语义分析模型的训练集图像提取功能,对原始数据集进行基于主题的聚类,帮助用户快速选取训练集图像;加入了SVM分类模型,利用提取出来的训练集对未标注图像进行分类标注,实现了完整的系统。实验结果表明,该方案能够满足海量图像数据分类和标注的功能和性能需求。 相似文献
13.
通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵.考虑到多用户之间社交关系对挖掘用户兴趣并进行微博推荐的重要性,构建用户-用户社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户兴趣并进行相关推荐.实验证明了该算法针对微博信息推荐是有效的. 相似文献
14.
15.
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值. 相似文献
16.
随着社交媒体的快速发展,人们在微博等平台上表达情感的方式也得到了极大的丰富和多样。因此,针对中文微博情感分析的研究变得尤为重要。为提高中文微博情感分析的效果,设计了一种基于BERT-BiGRU和多尺度卷积神经网络(Convolutional Neural Networks, CNN)的中文微博情感分析模型。具体来说,首先,利用预训练的BERT模型对微博文本进行编码;然后,通过BiGRU捕捉上下文信息和语境特征,并利用多尺度CNN提取文本中重要的局部情绪特征;最后,使用全连接层进行情感分类。在SMP2020发布的公开微博数据集上进行比较实验,实验结果表明,提出的模型在中文微博情感分类任务上取得了较好的表现,具有更高的准确性和泛化能力。 相似文献
17.
新浪微博数据获取技术研究 总被引:1,自引:0,他引:1
随着微博在人们日常生活中的广泛使用,微博信息的数据获取成为研究微博的基础和保证。该文提出基于新浪微博开放平台与基于网络数据流的微博数据获取方案。前者通过程序调用新浪微博应用编程接口(API),针对API提供的数据进行分类别归一化解析储存。后者采取捕捉网络信道实时数据流方式,可对指定地域微博用户的网络行为进行实时监控。通过程序调试和实验测试,两套方案的有效结合可实现对新浪微博数据的高效全面获取。 相似文献
18.
基于网络用户行为的相关页面挖掘模型 总被引:11,自引:0,他引:11
郭岩 《微电子学与计算机》2003,20(5):76-82,109
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。 相似文献
19.