首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
智慧城市依赖于对大数据的充分利用。近年来,随着移动互联网的发展,在线微博平台,比如新浪微博、Twitter等,已经成为了大数据的主要来源之一。微博平台上产生的海量短文文本信息使用户很难找到自己感兴趣主题的相关信息。本文提出了一种基于限制性玻尔兹曼机的微博短文本的主题分类方法。通过对短文本进行主题建模,挖掘出潜在主题信息,根据短文本的潜在主题信息可实现对短文本的主题分类。  相似文献   

2.
《现代电子技术》2016,(8):41-44
针对传统推送技术存在推送效率低、局限性大及安全性差的问题,提出基于文化安全的微博信息推送技术;该技术下的微博信息推送系统主要包括用户兴趣模块、关键词采集模块、文本分类模块以及信息推送模块。系统通过用户兴趣模块,为用户提供符合文化安全要求的信息;采用基于主题词表的贝叶斯方法,获取微博文本中的关键词。通过关键词和文化安全类别的互信息值,塑造关键词-文化安全类别关系表,实现微博文本的分类;再经过信息推送模块,将文化安全类的微博信息推送给用户。实验结果表明,该方法具有更优的查准率和召回率指标,实现了很好的信息推送服务。  相似文献   

3.
微博转发是微博网络中信息得以传播的基础,对用户影响力评估以及网络营销等具有重要意义。现有的方法在考虑影响用户转发行为的因素时,大多只考虑微博以及用户属性等特征,没有考虑用户兴趣和用户历史行为规律等个性化特征,本文提出了基于LDA主题模型的用户兴趣与微博相似度计算方法,将计算结果作为用户兴趣特征,还提出了基于用户转发率、与上游用户交互频率的用户历史行为特征,最后融合用户兴趣特征、用户历史行为特征、上游用户特征、微博特征,建立基于几种常见分类模型的预测方法,在真实数据集上的实验结果表明,该方法能够有效提升预测准确性,取得较好的预测效果。  相似文献   

4.
基于用户兴趣和推荐信任域的微博推荐   总被引:1,自引:0,他引:1  
向用户推荐其感兴趣的微博,是改善用户体验的重要途径.为使推荐的微博更加符合用户的兴趣和品味,提出的微博推荐方法不仅考虑用户自身的特点,而且还考虑所在社区对微博的评价.在技术实现上,采用支持向量机进行文本分类,以便发现用户的兴趣偏好;通过多维Newman算法进行用户社区的发现,并将社区视为推荐信任域.最后采用改进的协同过滤算法综合用户兴趣偏好和推荐信任域进行微博推荐,以此提高微博推荐的质量.实验结果表明,提出的微博推荐方法是切实有效的.  相似文献   

5.
微博作为“自媒体”时代的信息共享和交流工具,其传播价值日益显露。本文从实证角度出发,以“环球企业家杂志”账户的一条微博为样本数据,研究了微博信息传播范围逐层急剧增加、短时间快速衰减,微博用户因共同兴趣、爱好聚集的规律,探讨了有效利用微博进行信息传播的方法。  相似文献   

6.
《世界电信》2012,(3):25-25
新浪微博是中国最流行的微博客平台,预计将在今年晚些时候启动商业化。目前,北京、上海和广州等地的微博用户需要提供真实身份信息,才能继续在微博上发布新消息。分析人士认为,此举不可能导致微博用户参与度的急剧下跌,反而会增加广告主的投放兴趣。实名制能够清除微博垃圾账户,并使新浪获得宝贵的用户信息,推动这一社交平台的盈利。  相似文献   

7.
一种基于用户动态兴趣和社交网络的微博推荐方法   总被引:1,自引:0,他引:1       下载免费PDF全文
陈杰  刘学军  李斌  章玮 《电子学报》2017,45(4):898-905
针对为微博用户推荐符合其兴趣取向的个性化微博信息的问题,结合LDA主题模型,提出了一种基于用户动态兴趣和社交网络(DISN)的微博推荐方法.DISN方法首先引入时间函数,推断出用户的兴趣向量,通过对新发布的微博数据内容进行聚类分组,以用户兴趣向量筛选与用户最匹配的分组,随后以网格索引的形式对选定的分组中微博进行查询,计算微博发布者被目标用户关注的可能性并进行排序,最终形成推荐列表.实验验证了DISN方法较之传统方法更具有效性和高效性.  相似文献   

8.
微博平台的兴起革新了人们的互动方式,给人们获取信息带来了极大便利.然而,在信息超载的环境下,人们需要花费大量的时间从许多冗余的微博信息中寻找自己感兴趣的信息,剔除无用信息.针对该问题,本文设计了一种新的方法对用户的微博信息进行过滤.该方法在传统方法基础上增加用户反馈环节;同时,考虑用户兴趣随时间变化的特点,在进行信息过滤时考虑时间对兴趣度的影响.该方法为微博信息个性化过滤提供了一种新思路.  相似文献   

9.
主题特征格分析:一种用户生成文本质量评估方法   总被引:2,自引:0,他引:2       下载免费PDF全文
钟将  张淑芳  郭卫丽  李雪 《电子学报》2018,46(9):2201-2206
本文设计了一种用户生成文本的质量分析框架.首先,基于主题分析构建商品类别主题特征集合.其次,利用主题特征与商品分类的强关联关系,构建形式化概念分析的形式背景,将分类-主题概念格化简并生成主题特征格,以此构建五个质量特征并生成质量评估模型.最后,在真实评论数据上的实验结果表明新方法具有更高预测精度.  相似文献   

10.
本文在综合兴趣模型研究现状的基础上,结合微博数据集对微博用户的特征进行分析,建立微博用户兴趣模型,并提出基于微博用户兴趣模型的发现算法。实验结果表明,本文提出的算法能很好的发现微博用户的兴趣,提高推荐系统的质量。  相似文献   

11.
武晓丹 《电子测试》2022,(24):47-49+69
随着互联网飞速发展,微博等社交媒体也迅速成长起来,与此同时,微博平台上网络水军也越来越多。为了能够识别水军,还网络世界一个清净之地,本文针对Twitter平台,利用3个不同数据集以及Scikit-Learn库中3种分类算法进行实验,实验采用相关性检验方法比较不同特征集差异,得出提高分类效果准确率的有效特征,并通过不同机器学习算法训练数据集,得出最优算法。本实验在Twitter真实数据集下进行,实验结果表明“,推特用户收藏、回复、转发总数actions”特征的引入在很大程度上提高了分类效果准确率;并且相较于支持向量机与K最近邻算法,随机森林分类法能够更有效识别水军。  相似文献   

12.
为有效处理并利用互联网海量的图像和视频数据,提出了一种基于Hadoop云平台的图像分类和标注解决方案。针对如何高效地进行训练集提取这一重要问题,搭建了基于云计算的图像抓取平台,利用互联网的图像资源作为原始数据集,为提取训练集图像提供足够的数据;实现了基于概率潜在语义分析模型的训练集图像提取功能,对原始数据集进行基于主题的聚类,帮助用户快速选取训练集图像;加入了SVM分类模型,利用提取出来的训练集对未标注图像进行分类标注,实现了完整的系统。实验结果表明,该方案能够满足海量图像数据分类和标注的功能和性能需求。  相似文献   

13.
通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵.考虑到多用户之间社交关系对挖掘用户兴趣并进行微博推荐的重要性,构建用户-用户社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户兴趣并进行相关推荐.实验证明了该算法针对微博信息推荐是有效的.  相似文献   

14.
卜俊丽  彭灿  郑毅  黄九鸣  周斌 《通信学报》2014,35(Z2):31-232
微博社交网络在在线社交平台中扮演着重要角色,微博言论对网络舆论的贡献越来越大,网络舆论监测存在巨大挑战。转世账户是在网络舆论监测过程中出现的一类特殊的账户。加强这些账户的监测力度对于监测网络舆论有着很大的意义,实施监测的首要前提是发现这些账户。针对转世账户的特点进行模型设计,提出了一种基于时序和相似性的转世账户研判模型,并基于新浪数据进行了有效性的验证。  相似文献   

15.
王友卫  刘元宁  凤丽洲  朱晓冬 《电子学报》2015,43(10):1963-1970
为在不显著降低垃圾邮件识别精度的同时有效提高邮件识别速度,提出了一种在线垃圾邮件快速识别新方法.首先引入用户正、负兴趣集的概念,结合用户兴趣集及支持向量机对邮件进行分类;然后根据主动学习理论,结合训练集样本密度及改进角度差异方法寻找分类最不确定的样本并推荐给用户进行类别标注;最后将标注后样本及分类最确定性样本加入训练集,并使用样本价值评价新函数淘汰冗余样本以生成新的训练集.实验表明,本文方法的用户标注负担小,垃圾邮件识别精度高、速度快,具有较高的在线应用价值.  相似文献   

16.
随着社交媒体的快速发展,人们在微博等平台上表达情感的方式也得到了极大的丰富和多样。因此,针对中文微博情感分析的研究变得尤为重要。为提高中文微博情感分析的效果,设计了一种基于BERT-BiGRU和多尺度卷积神经网络(Convolutional Neural Networks, CNN)的中文微博情感分析模型。具体来说,首先,利用预训练的BERT模型对微博文本进行编码;然后,通过BiGRU捕捉上下文信息和语境特征,并利用多尺度CNN提取文本中重要的局部情绪特征;最后,使用全连接层进行情感分类。在SMP2020发布的公开微博数据集上进行比较实验,实验结果表明,提出的模型在中文微博情感分类任务上取得了较好的表现,具有更高的准确性和泛化能力。  相似文献   

17.
新浪微博数据获取技术研究   总被引:1,自引:0,他引:1  
随着微博在人们日常生活中的广泛使用,微博信息的数据获取成为研究微博的基础和保证。该文提出基于新浪微博开放平台与基于网络数据流的微博数据获取方案。前者通过程序调用新浪微博应用编程接口(API),针对API提供的数据进行分类别归一化解析储存。后者采取捕捉网络信道实时数据流方式,可对指定地域微博用户的网络行为进行实时监控。通过程序调试和实验测试,两套方案的有效结合可实现对新浪微博数据的高效全面获取。  相似文献   

18.
基于网络用户行为的相关页面挖掘模型   总被引:11,自引:0,他引:11  
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。  相似文献   

19.
蔡鑫  娄京生 《电信科学》2017,33(12):136-141
中国电信官方微博(简称电信官微)作为一种互联网媒体,是中国电信对外发布信息并获取用户反馈的重要渠道。用户对电信官微消息内容的评论,反映了用户对中国电信品牌、产品和服务的不同态度。爬取了电信官微的消息内容和评论数据,对经过清洗的数据采用Word2vec进行文本信息表示,并使用深度学习平台基于LSTM深度神经网络模型进行用户交互文本的正负面情感分类,实现电信官微访问用户情绪分析。  相似文献   

20.
微博由于其开放、低门槛、终端扩展、内容简洁的特征,已经成为一个信息分享、传播以及获取的大众新闻时事的重要平台,而微博中的海量文本基本都是短文本快节奏的数据,等待我们去分析其中蕴含的大量的信息。这里突出介绍了LDA主题模型和Gibbs Sampling采样算法。通过实验用LDA模型来进行主题挖掘,挖掘出来的每个主题即为该用户的兴趣和爱好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号