首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 437 毫秒
1.
新浪微博话题流行度预测技术研究   总被引:1,自引:0,他引:1       下载免费PDF全文
微博作为一种新的在线社会网形式,逐渐成为人们获取和共享信息的重要平台。以我国最大的微博网站——新浪微博为对象,重点研究了微博话题的流行度预测问题。收集了大约40G的微博话题信息作为研究数据集,从中提取出与话题流行度相关的微博用户属性和话题内容属性,在对这些属性相关性分析的基础上,提出了一种兼顾用户属性和内容属性的话题流行度定量描述方法。文章对影响话题流行度的各属性进行了详细的主成分分析,总结出4种属性作为话题流行度预测的依据,并建立了流行度的线性预测模型。该模型能较好地预测话题流行度,模型指标R2达到0.89。  相似文献   

2.
Twitter、Sina Micro-blog等社交网络应用为基于位置的服务提供了大量的情境信息,如用户ID(who)、签到时间(when)、GPS坐标(where)、微博内容主题词(what)和微博内容诱因词(why)等,简称5W。它们为用户的行为和偏好研究提供了契机。该文提出了基于5W动态情境感知信息的W5概率模型,并采用包含情境信息的联合概率分布分别从时间、空间和活动等方面挖掘用户动态行为,用于用户和位置的预测。该文实验基于两个数据集:Geo-text(GT)和Sina-tweets(ST),在数据集上进行了用户预测(UP)和位置预测(LP)实验。实验结果表明,W5模型在UP和LP两方面准确率均高于W4模型。同时,W5模型在时间误差和空间距离误差两方面也取得了较好的性能。  相似文献   

3.
运用Twitter-LDA主题模型对新浪微博数据进行了主题分析,基于用户主题兴趣相关性的研究表明用户间的主题兴趣具有三度相关性,同一主题兴趣下三度以内粉丝的发文数随用户发文数增加而波动式增加,各度粉丝与用户主题兴趣的相似度随粉丝度数的增加而下降。通过分析比较不同主题类别微博的扩散差异,发现生活情感类的信息最受用户欢迎,不同主题类别微博被转发的概率存在显著差异,平均转发数相差可达10倍,微博信息扩散树中各类主题在微博信息扩散深度、扩散时间间隔和用户的扩散能力方面都表现出不同的特征。  相似文献   

4.
目前,对微博转发行为预测主要是对所有微博用户的历史数据进行学习,从而得到转发模型.但是这类模型需要对所有用户的转发行为进行全局预测,存在同质性且无法对具体用户进行个性化预测的缺陷.针对这些问题,提出了基于多任务学习的个性化微博转发行为预测算法.对新浪微博进行了数据抓取、分析和特征选择,根据社会学中影响力的理论,针对微博用户之间进行社交信息交流而导致相互影响的特点,引入了多任务学习方法,以逻辑回归预测模型作为基准算法,将预测模型分为全局模型与个性模型进行学习.预测模型把对每个用户转发行为的预测对应为多个任务,根据微博用户间的社交交互对这些任务进行关联.实验结果表明,所提出的模型能够有效地对单个用户的微博转发行为进行预测,并且提高了转发行为预测的准确率.  相似文献   

5.
提出了一种基于上下文依赖的动态图卷积网络(context dependent dynamic graph convolutional network,CDGCN)对在线社交网络进行信息流行度预测,即根据信息的历史转发动态预测将来的流行度。根据信息转发动态构建转发网络,并将转发文本嵌入作为节点属性。C-DGCN基于扩散核的图卷积网络对转发网络进行嵌入,得到空间依赖表示,并输入循环神经网络(recurrent neural network, RNN)学习实时依赖表示。在2020年1月的微博数据集上进行了实验,并将C-DGCN与传统的基于特征设计、基于生成模型、基于深度学习的方法进行了比较。CDGCN的优势在于:1)充分考虑了文本内容对信息传播的驱动作用,建模表示了语义特性变化的影响,捕获了上下文依赖特性;2)扩散核是基于时间延迟特性的,循环神经网络能够捕获实时特性,充分建模表示了信息传播的时-空依赖。  相似文献   

6.
针对目前的主题挖掘只考虑主题内容的概率分布方法,本文提出一种综合考虑内容、时间等因素的微博主题挖掘模型mixtureLDA. 该模型能够分析用户不同类型微博的主题概率分布和时间微博主题概率. 实验使用新浪微博数据集,结果表明基于mixtureLDA的微博主题挖掘模型能够有效地挖掘出用户微博和时间微博的主题概率分布. 与MB-LDA、userLDA模型对比,mixtureLDA模型可有效降低困惑度.  相似文献   

7.
为了解决传统图卷积神经网络在进行谣言检测时面临的未充分考虑单词语义信息以及池化方法选择困难的问题,提出基于图卷积网络(GCN)的归纳式微博谣言检测新方法. 考虑单词之间的语义关系,结合传统词共现建图方法提出基于词语义相关性的微博事件建图方法,并结合图卷积网络和门循环单元(GRU)实现节点信息聚合;为了有效融合不同节点状态的特征信息,提出基于注意力机制的多池化方法融合策略融合最大池、平均池和全局池以获取最终的图级向量;为了提高微博谣言检测效率,探究微博评论时间对检测结果的影响,获得用于模型训练的最佳评论利用时间阈值. 实验结果表明,本研究方法在给定数据集上的表现普遍优于Text-CNN、Bi-GCN、TextING等典型方法,验证了其在微博谣言检测领域的有效性.  相似文献   

8.
针对微博在高校学生群体中的应用情况,采用基于自我效能感的价值接受度模型(SVAM)和价值接受度模型(VAM)分别对其进行了实证研究。结果表明,微博的情感价值、功能价值和社会价值是微博感知价值的主要影响因素,微博的自我效能感对情感价值和功能价值的形成具有显著影响,且与感知价值一起直接影响了用户的态度,甚至采用意图。进一步的对比研究发现,自我效能感对采用态度的影响不容忽视,并影响模型对采用意图的解释度。  相似文献   

9.
基于社会化媒体节点属性的信息预测   总被引:1,自引:0,他引:1  
针对多数研究仅将社会化媒体作为数据来源的现状,深入分析社会化媒体特点,重点将节点属性分为静态和动态进行研究,提出基于预测目标的节点影响力的概念.在此基础上提出了一种基于节点属性进行信息预测的属性、节点数、倾向(ANV)模型.实验采用后向传播(BP)神经网络预测方法,通过新浪微博数据预测电影票房.仿真表明,带有节点属性的方法比没有节点属性的方法拟合和预测更为准确.  相似文献   

10.
微博作为信息发布和获取的重要手段,已成为最重要的媒体之一。用户每天在微博上发言,其内容隐含着许多重要话题。在话题检测过程中,话题网络构建是一项最基本的内容。将微博发言作为节点,将节点间包含共同的词汇作为边,应用MapReduce编程模型作为海量数据处理的平台,研究了微博信息中大规模话题网络的构建方法。实验表明,基于MapReduce构建的话题网络符合社会网络的相关性质,并且其话题预测的准确性也高于基于LDA模型的话题检测。  相似文献   

11.
根据社会存在用电量不确定因素较多,变化趋势较为明显的特点,基于灰系统理论建立灰模型(GreyModel,GM)对用电量进行灰预测;用新信息替代旧信息构造了新息GM(1,1)模型,并及时反映目标值的时变特性,更好地考虑实际数据的影响。算例表明:模型的置信度达到99.15%,而误差仅为2.96%,说明用GM(1,1)模型进行用电量预测是有效的。  相似文献   

12.
提出的预测模型采取分时序分段策略,使用卷积神经网络(CNN)提取景区多因素时序数据的特征,并对不同因素的时序数据赋予不同的权重,将结果送入门控循环单元(GRU)以挖掘其中的时序信息,结合预测时刻的情境信息(天气状况和节假日)预测短期景区内游客人数. 在某景区的闸机数据集和监控点车辆数据集上的实验结果表明:基于门控循环单元的多因素感知短期游客人数预测模型可以充分考虑多情境因素并对不同因素时序数据赋予不同的权重,均方根误差(RMSE)和平均绝对百分比误差(MAPE)均小于传统模型,能够有效降低短期游客人数预测误差。  相似文献   

13.
Design and operation optimization of centrifugal compressor are always based on an accurate prediction model, however, due to the short time operation and lack of data information, it is difficult to get an accurate prediction model of a new centrifugal compressor in time. This paper applies an improved fast model migration method (FMM method) to develop the model of the new centrifugal compressor. The method adapts a Gaussian Process (GP) model from an old centrifugal compressor to fit a new and similar centrifugal compressor, and the adaptation is conducted by a scale-bias adjustment migration technology. In order to obtain the better estimated parameters of migration, Bayesian method, which takes the prior knowledge into consideration, is used in the sequential experiment. The approach is validated by a specific simulation bench. The results indicate that the applied approach can achieve a better prediction precision with fewer data of the new centrifugal compressor compared to pure GP method, and can model the new centrifugal compressor rapidly.  相似文献   

14.
Much attention has been given to time series pre-diction in many fields, such as fault diagnosis[1],weather forecast, oil exploration, electric power distri-bution, satellite communication etc. However, mostprediction methods use a linear model to represent thepredicted object in a stationary time series, such as theAR and ARMA model prediction. Because the sam-pling data can be affected by many practical measure-ment factors, the sampling data rarely meets the hypot-heses of stationarity an…  相似文献   

15.
针对微博行文自由性大,情感倾向识别困难的问题,提出了一种基于混合高斯分布伪样本生成技术和条件随机场模型的新方法。该方法首先利用混合高斯分布模型来为训练集中的少数类生成伪样本从而构建一个情感倾向分布平衡的训练集,然后通过使用Word2vec来扩展微博句子以丰富它的情感信息,从而缓解情感词典不足够大对情感分类的负面影响;最后将条件随机场模型应用在上面已经平衡和扩展后的训练集上.实验结果表明该方法比现有方法在数据集情感倾向分布不平衡时能更有效地识别微博的情感倾向.  相似文献   

16.
为了对微博用户、微博文本和微博评论进行分析和研究,提出了一种基于转发评论的微博语义扩充和分类方法.首先在对微博用户类型分析的基础上将微博分为6种类型;然后以信息发布型微博为研究对象,提出了微博评论选择算法,筛选出微博有效评论;再利用基于转发评论的微博语义扩充和分类(comment-based microblog's semantic expansion and classification,CBMSEC)方法,将微博有效评论信息补充进微博语义,改善微博数据稀疏的问题,提高微博的分类性能.  相似文献   

17.
为克服预测神经网络输入值对网络输出预测值贡献程度基本等同的缺陷,提出一种信息熵加权的神经网络智能预测方法。提出信息熵权值的计算方法和延时重构的加权前处理方法,并以Elman神经网络为基础,构建基于信息熵加权Elman神经网络的预测模型。烟气轮机状态趋势预测实例表明,基于信息熵加权Elman神经网络预测方法的预测效果较好,为状态趋势预测提供了一种新方法。  相似文献   

18.
To address the problems that the pedestrian interaction feature of the Social GAN is simple and that it cannot make full use of the most of pedestrian interaction information, this paper proposes a pedestrian trajectory prediction model with social features and attention mechanism. This model adapts the structure of generative adversarial networks. The generator adapts an encoder-decoder model and the attention model is put between encoder and decoder. Three social features are set to enrich pedestrian interaction information which assists the attention module to make full use of the most of pedestrian interaction information by allocating the influence of pedestrians in the scene, so that the accuracy of the model is improved. Experimental results on multiple datasets show that the accuracy of this model in the pedestrian trajectory prediction task is increased by 15% compared with the previous pedestrian trajectory prediction model based on the pooling module. The improvement effect is most obvious in scenes with dense pedestrians and lots of non-straight tracks, with the accuracy increased by 34%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号