共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
《电子技术与软件工程》2017,(3)
微博转发是微博网络中信息得以传播的基础,对用户影响力评估以及网络营销等具有重要意义。现有的方法在考虑影响用户转发行为的因素时,大多只考虑微博以及用户属性等特征,没有考虑用户兴趣和用户历史行为规律等个性化特征,本文提出了基于LDA主题模型的用户兴趣与微博相似度计算方法,将计算结果作为用户兴趣特征,还提出了基于用户转发率、与上游用户交互频率的用户历史行为特征,最后融合用户兴趣特征、用户历史行为特征、上游用户特征、微博特征,建立基于几种常见分类模型的预测方法,在真实数据集上的实验结果表明,该方法能够有效提升预测准确性,取得较好的预测效果。 相似文献
4.
5.
微博作为“自媒体”时代的信息共享和交流工具,其传播价值日益显露。本文从实证角度出发,以“环球企业家杂志”账户的一条微博为样本数据,研究了微博信息传播范围逐层急剧增加、短时间快速衰减,微博用户因共同兴趣、爱好聚集的规律,探讨了有效利用微博进行信息传播的方法。 相似文献
6.
7.
针对为微博用户推荐符合其兴趣取向的个性化微博信息的问题,结合LDA主题模型,提出了一种基于用户动态兴趣和社交网络(DISN)的微博推荐方法.DISN方法首先引入时间函数,推断出用户的兴趣向量,通过对新发布的微博数据内容进行聚类分组,以用户兴趣向量筛选与用户最匹配的分组,随后以网格索引的形式对选定的分组中微博进行查询,计算微博发布者被目标用户关注的可能性并进行排序,最终形成推荐列表.实验验证了DISN方法较之传统方法更具有效性和高效性. 相似文献
8.
微博平台的兴起革新了人们的互动方式,给人们获取信息带来了极大便利.然而,在信息超载的环境下,人们需要花费大量的时间从许多冗余的微博信息中寻找自己感兴趣的信息,剔除无用信息.针对该问题,本文设计了一种新的方法对用户的微博信息进行过滤.该方法在传统方法基础上增加用户反馈环节;同时,考虑用户兴趣随时间变化的特点,在进行信息过滤时考虑时间对兴趣度的影响.该方法为微博信息个性化过滤提供了一种新思路. 相似文献
9.
10.
为了给旅行者提供决策帮助,提出基于GPS轨迹的旅游兴趣点智能挖掘方法。采用GPS技术收集用户活动轨迹并聚类轨迹点,聚类点分类集合后进行分割,实现道路拟合,得到旅游兴趣点路网;通过用户和相似用户在此路网中的签到次数获取兴趣点,并归一化兴趣点评分结果,构建基于用户和社会关系的模型,解决协同过滤扩展问题,利用兴趣点流行度建立地理相关性模型进行二次过滤,求出用户可能感兴趣的兴趣点;采用标准变化加权法融合三种模型,构建兴趣点挖掘模型。实验结果表明,所提方法的内存分配合理,均方根误差低和AUC曲线低。 相似文献
11.
本文在综合兴趣模型研究现状的基础上,结合微博数据集对微博用户的特征进行分析,建立微博用户兴趣模型,并提出基于微博用户兴趣模型的发现算法。实验结果表明,本文提出的算法能很好的发现微博用户的兴趣,提高推荐系统的质量。 相似文献
12.
随着互联网飞速发展,微博等社交媒体也迅速成长起来,与此同时,微博平台上网络水军也越来越多。为了能够识别水军,还网络世界一个清净之地,本文针对Twitter平台,利用3个不同数据集以及Scikit-Learn库中3种分类算法进行实验,实验采用相关性检验方法比较不同特征集差异,得出提高分类效果准确率的有效特征,并通过不同机器学习算法训练数据集,得出最优算法。本实验在Twitter真实数据集下进行,实验结果表明“,推特用户收藏、回复、转发总数actions”特征的引入在很大程度上提高了分类效果准确率;并且相较于支持向量机与K最近邻算法,随机森林分类法能够更有效识别水军。 相似文献
13.
基于广受欢迎的微博平台,利用新浪微博提供的API接口及网络爬虫技术从微博中提取用户数据,通过支持向量机算法(SVM)将微博用户分为水军用户和非水军用户两类。再利用改进的支持向量机算法(SVM)从大量的用户数据中提取特征值,实现多分类支持向量机模型,将用户分为正常用户、炒作型水军、营销型水军、谣言型水军四类。研究结果表明,构建的模型可以较为准确地识别出用户的类型,识别误差率较低。 相似文献
14.
本文首先对自媒体文本进行去噪、分词、去停用词等预处理,提取文本特征,构建基于Bi-LSTM模型的文本情感分类器,并利用已训练好的情感分类器对实时采集的自媒体文本进行情感分类,为用户提供可视化的话题舆情监测。 相似文献
15.
为有效处理并利用互联网海量的图像和视频数据,提出了一种基于Hadoop云平台的图像分类和标注解决方案。针对如何高效地进行训练集提取这一重要问题,搭建了基于云计算的图像抓取平台,利用互联网的图像资源作为原始数据集,为提取训练集图像提供足够的数据;实现了基于概率潜在语义分析模型的训练集图像提取功能,对原始数据集进行基于主题的聚类,帮助用户快速选取训练集图像;加入了SVM分类模型,利用提取出来的训练集对未标注图像进行分类标注,实现了完整的系统。实验结果表明,该方案能够满足海量图像数据分类和标注的功能和性能需求。 相似文献
16.
通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵.考虑到多用户之间社交关系对挖掘用户兴趣并进行微博推荐的重要性,构建用户-用户社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户兴趣并进行相关推荐.实验证明了该算法针对微博信息推荐是有效的. 相似文献
17.
18.
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值. 相似文献
19.
构建突发环境事件中微博影响力预测模型,有助于相关部门及早发现问题,并采取行动,保障网络舆情平稳发展。因此,本文以“xx突发环境事件”为研究对象,根据微博转发、点赞和评论次数衡量其影响力,选取微博用户、内容、时间特征,建立基于AdaBoost算法的微博影响力预测模型,并对微博特征重要性进行分析,结果表明该模型的预测精度可达到93.2%,能够较好地完成预测任务。此外,微博的内容、时间特征、用户基本信息、用户活跃度均对微博影响力产生作用,长文本的、通知类的微博影响力更高,白天发布的微博影响力要比晚上发布的高,政府媒体用户和大V用户发布的微博影响力更高,原创度高的用户发布的微博影响力也会更高。 相似文献
20.
随着社交媒体的快速发展,人们在微博等平台上表达情感的方式也得到了极大的丰富和多样。因此,针对中文微博情感分析的研究变得尤为重要。为提高中文微博情感分析的效果,设计了一种基于BERT-BiGRU和多尺度卷积神经网络(Convolutional Neural Networks, CNN)的中文微博情感分析模型。具体来说,首先,利用预训练的BERT模型对微博文本进行编码;然后,通过BiGRU捕捉上下文信息和语境特征,并利用多尺度CNN提取文本中重要的局部情绪特征;最后,使用全连接层进行情感分类。在SMP2020发布的公开微博数据集上进行比较实验,实验结果表明,提出的模型在中文微博情感分类任务上取得了较好的表现,具有更高的准确性和泛化能力。 相似文献