首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
智慧城市依赖于对大数据的充分利用。近年来,随着移动互联网的发展,在线微博平台,比如新浪微博、Twitter等,已经成为了大数据的主要来源之一。微博平台上产生的海量短文文本信息使用户很难找到自己感兴趣主题的相关信息。本文提出了一种基于限制性玻尔兹曼机的微博短文本的主题分类方法。通过对短文本进行主题建模,挖掘出潜在主题信息,根据短文本的潜在主题信息可实现对短文本的主题分类。  相似文献   

2.
《现代电子技术》2016,(8):41-44
针对传统推送技术存在推送效率低、局限性大及安全性差的问题,提出基于文化安全的微博信息推送技术;该技术下的微博信息推送系统主要包括用户兴趣模块、关键词采集模块、文本分类模块以及信息推送模块。系统通过用户兴趣模块,为用户提供符合文化安全要求的信息;采用基于主题词表的贝叶斯方法,获取微博文本中的关键词。通过关键词和文化安全类别的互信息值,塑造关键词-文化安全类别关系表,实现微博文本的分类;再经过信息推送模块,将文化安全类的微博信息推送给用户。实验结果表明,该方法具有更优的查准率和召回率指标,实现了很好的信息推送服务。  相似文献   

3.
微博转发是微博网络中信息得以传播的基础,对用户影响力评估以及网络营销等具有重要意义。现有的方法在考虑影响用户转发行为的因素时,大多只考虑微博以及用户属性等特征,没有考虑用户兴趣和用户历史行为规律等个性化特征,本文提出了基于LDA主题模型的用户兴趣与微博相似度计算方法,将计算结果作为用户兴趣特征,还提出了基于用户转发率、与上游用户交互频率的用户历史行为特征,最后融合用户兴趣特征、用户历史行为特征、上游用户特征、微博特征,建立基于几种常见分类模型的预测方法,在真实数据集上的实验结果表明,该方法能够有效提升预测准确性,取得较好的预测效果。  相似文献   

4.
基于用户兴趣和推荐信任域的微博推荐   总被引:1,自引:0,他引:1  
向用户推荐其感兴趣的微博,是改善用户体验的重要途径.为使推荐的微博更加符合用户的兴趣和品味,提出的微博推荐方法不仅考虑用户自身的特点,而且还考虑所在社区对微博的评价.在技术实现上,采用支持向量机进行文本分类,以便发现用户的兴趣偏好;通过多维Newman算法进行用户社区的发现,并将社区视为推荐信任域.最后采用改进的协同过滤算法综合用户兴趣偏好和推荐信任域进行微博推荐,以此提高微博推荐的质量.实验结果表明,提出的微博推荐方法是切实有效的.  相似文献   

5.
微博作为“自媒体”时代的信息共享和交流工具,其传播价值日益显露。本文从实证角度出发,以“环球企业家杂志”账户的一条微博为样本数据,研究了微博信息传播范围逐层急剧增加、短时间快速衰减,微博用户因共同兴趣、爱好聚集的规律,探讨了有效利用微博进行信息传播的方法。  相似文献   

6.
《世界电信》2012,(3):25-25
新浪微博是中国最流行的微博客平台,预计将在今年晚些时候启动商业化。目前,北京、上海和广州等地的微博用户需要提供真实身份信息,才能继续在微博上发布新消息。分析人士认为,此举不可能导致微博用户参与度的急剧下跌,反而会增加广告主的投放兴趣。实名制能够清除微博垃圾账户,并使新浪获得宝贵的用户信息,推动这一社交平台的盈利。  相似文献   

7.
一种基于用户动态兴趣和社交网络的微博推荐方法   总被引:1,自引:0,他引:1       下载免费PDF全文
陈杰  刘学军  李斌  章玮 《电子学报》2017,45(4):898-905
针对为微博用户推荐符合其兴趣取向的个性化微博信息的问题,结合LDA主题模型,提出了一种基于用户动态兴趣和社交网络(DISN)的微博推荐方法.DISN方法首先引入时间函数,推断出用户的兴趣向量,通过对新发布的微博数据内容进行聚类分组,以用户兴趣向量筛选与用户最匹配的分组,随后以网格索引的形式对选定的分组中微博进行查询,计算微博发布者被目标用户关注的可能性并进行排序,最终形成推荐列表.实验验证了DISN方法较之传统方法更具有效性和高效性.  相似文献   

8.
微博平台的兴起革新了人们的互动方式,给人们获取信息带来了极大便利.然而,在信息超载的环境下,人们需要花费大量的时间从许多冗余的微博信息中寻找自己感兴趣的信息,剔除无用信息.针对该问题,本文设计了一种新的方法对用户的微博信息进行过滤.该方法在传统方法基础上增加用户反馈环节;同时,考虑用户兴趣随时间变化的特点,在进行信息过滤时考虑时间对兴趣度的影响.该方法为微博信息个性化过滤提供了一种新思路.  相似文献   

9.
主题特征格分析:一种用户生成文本质量评估方法   总被引:2,自引:0,他引:2       下载免费PDF全文
钟将  张淑芳  郭卫丽  李雪 《电子学报》2018,46(9):2201-2206
本文设计了一种用户生成文本的质量分析框架.首先,基于主题分析构建商品类别主题特征集合.其次,利用主题特征与商品分类的强关联关系,构建形式化概念分析的形式背景,将分类-主题概念格化简并生成主题特征格,以此构建五个质量特征并生成质量评估模型.最后,在真实评论数据上的实验结果表明新方法具有更高预测精度.  相似文献   

10.
郝一川 《信息技术》2022,(8):126-130
为了给旅行者提供决策帮助,提出基于GPS轨迹的旅游兴趣点智能挖掘方法。采用GPS技术收集用户活动轨迹并聚类轨迹点,聚类点分类集合后进行分割,实现道路拟合,得到旅游兴趣点路网;通过用户和相似用户在此路网中的签到次数获取兴趣点,并归一化兴趣点评分结果,构建基于用户和社会关系的模型,解决协同过滤扩展问题,利用兴趣点流行度建立地理相关性模型进行二次过滤,求出用户可能感兴趣的兴趣点;采用标准变化加权法融合三种模型,构建兴趣点挖掘模型。实验结果表明,所提方法的内存分配合理,均方根误差低和AUC曲线低。  相似文献   

11.
本文在综合兴趣模型研究现状的基础上,结合微博数据集对微博用户的特征进行分析,建立微博用户兴趣模型,并提出基于微博用户兴趣模型的发现算法。实验结果表明,本文提出的算法能很好的发现微博用户的兴趣,提高推荐系统的质量。  相似文献   

12.
武晓丹 《电子测试》2022,(24):47-49+69
随着互联网飞速发展,微博等社交媒体也迅速成长起来,与此同时,微博平台上网络水军也越来越多。为了能够识别水军,还网络世界一个清净之地,本文针对Twitter平台,利用3个不同数据集以及Scikit-Learn库中3种分类算法进行实验,实验采用相关性检验方法比较不同特征集差异,得出提高分类效果准确率的有效特征,并通过不同机器学习算法训练数据集,得出最优算法。本实验在Twitter真实数据集下进行,实验结果表明“,推特用户收藏、回复、转发总数actions”特征的引入在很大程度上提高了分类效果准确率;并且相较于支持向量机与K最近邻算法,随机森林分类法能够更有效识别水军。  相似文献   

13.
基于广受欢迎的微博平台,利用新浪微博提供的API接口及网络爬虫技术从微博中提取用户数据,通过支持向量机算法(SVM)将微博用户分为水军用户和非水军用户两类。再利用改进的支持向量机算法(SVM)从大量的用户数据中提取特征值,实现多分类支持向量机模型,将用户分为正常用户、炒作型水军、营销型水军、谣言型水军四类。研究结果表明,构建的模型可以较为准确地识别出用户的类型,识别误差率较低。  相似文献   

14.
本文首先对自媒体文本进行去噪、分词、去停用词等预处理,提取文本特征,构建基于Bi-LSTM模型的文本情感分类器,并利用已训练好的情感分类器对实时采集的自媒体文本进行情感分类,为用户提供可视化的话题舆情监测。  相似文献   

15.
为有效处理并利用互联网海量的图像和视频数据,提出了一种基于Hadoop云平台的图像分类和标注解决方案。针对如何高效地进行训练集提取这一重要问题,搭建了基于云计算的图像抓取平台,利用互联网的图像资源作为原始数据集,为提取训练集图像提供足够的数据;实现了基于概率潜在语义分析模型的训练集图像提取功能,对原始数据集进行基于主题的聚类,帮助用户快速选取训练集图像;加入了SVM分类模型,利用提取出来的训练集对未标注图像进行分类标注,实现了完整的系统。实验结果表明,该方案能够满足海量图像数据分类和标注的功能和性能需求。  相似文献   

16.
通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵.考虑到多用户之间社交关系对挖掘用户兴趣并进行微博推荐的重要性,构建用户-用户社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户兴趣并进行相关推荐.实验证明了该算法针对微博信息推荐是有效的.  相似文献   

17.
卜俊丽  彭灿  郑毅  黄九鸣  周斌 《通信学报》2014,35(Z2):31-232
微博社交网络在在线社交平台中扮演着重要角色,微博言论对网络舆论的贡献越来越大,网络舆论监测存在巨大挑战。转世账户是在网络舆论监测过程中出现的一类特殊的账户。加强这些账户的监测力度对于监测网络舆论有着很大的意义,实施监测的首要前提是发现这些账户。针对转世账户的特点进行模型设计,提出了一种基于时序和相似性的转世账户研判模型,并基于新浪数据进行了有效性的验证。  相似文献   

18.
王友卫  刘元宁  凤丽洲  朱晓冬 《电子学报》2015,43(10):1963-1970
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值.  相似文献   

19.
构建突发环境事件中微博影响力预测模型,有助于相关部门及早发现问题,并采取行动,保障网络舆情平稳发展。因此,本文以“xx突发环境事件”为研究对象,根据微博转发、点赞和评论次数衡量其影响力,选取微博用户、内容、时间特征,建立基于AdaBoost算法的微博影响力预测模型,并对微博特征重要性进行分析,结果表明该模型的预测精度可达到93.2%,能够较好地完成预测任务。此外,微博的内容、时间特征、用户基本信息、用户活跃度均对微博影响力产生作用,长文本的、通知类的微博影响力更高,白天发布的微博影响力要比晚上发布的高,政府媒体用户和大V用户发布的微博影响力更高,原创度高的用户发布的微博影响力也会更高。  相似文献   

20.
随着社交媒体的快速发展,人们在微博等平台上表达情感的方式也得到了极大的丰富和多样。因此,针对中文微博情感分析的研究变得尤为重要。为提高中文微博情感分析的效果,设计了一种基于BERT-BiGRU和多尺度卷积神经网络(Convolutional Neural Networks, CNN)的中文微博情感分析模型。具体来说,首先,利用预训练的BERT模型对微博文本进行编码;然后,通过BiGRU捕捉上下文信息和语境特征,并利用多尺度CNN提取文本中重要的局部情绪特征;最后,使用全连接层进行情感分类。在SMP2020发布的公开微博数据集上进行比较实验,实验结果表明,提出的模型在中文微博情感分类任务上取得了较好的表现,具有更高的准确性和泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号