共查询到20条相似文献,搜索用时 171 毫秒
1.
2.
基于MB-LDA模型的微博主题挖掘 总被引:5,自引:0,他引:5
随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本身带有一些结构化的社会网络方面的信息,传统的文本挖掘算法不能很好地对它进行建模.提出了一个基于LDA的微博生成模型MB-LDA,综合考虑了微博的联系人关联关系和文本关联关系,来辅助进行微博的主题挖掘.采用吉布斯抽样法对模型进行推导,不仅能挖掘出微博的主题,还能挖掘出联系人关注的主题.此外,模型还能推广到许多带有社交网络性质的文本中.在真实数据集上的实验表明,MB-LDA模型能有效地对微博进行主题挖掘. 相似文献
3.
4.
2007年,一项名为Twitter的网络服务出现在互联网上,凭借简明直观的内容在很短的时间内便成为了热门的焦点,吸引了众多网络用户。随着Twitter的流行,互联网上诞生了一个崭新的名词——“微博”。 相似文献
5.
6.
很多朋友已经开始使用Windows 8,其中的社交网络提供了Facebook和Twitter的选择,但对于国内用户而言,显然只是一个鸡肋,他们使用的更多还是新浪微博。其实,我们可以考虑Windows 8人脉与新浪微博联系起来,这样就可以更加方便的查看好友动态: 相似文献
7.
微博即微博客,是Web2.0时代下衍生出的一种新型社会网络,其简单快捷的操作方式和随时随地发布信息的互动形式成为互联网的一大亮点。自2006年美国Obvious公司推出全球首个微博服务Twitter后,微博以惊人的发展速度受到国内外研究人员的广泛关注。该文首先对以Twitter为代表的微博其研究现状进行综述,主要包括(1)微博社会网络的特性分析,如微博用户网络的结构特征、微博用户的影响力分析及消息网络的信息传播机制等;(2)微博内容的语义分析,对微博中的情感语义分析进行了重点阐述;(3)微博的相关应用,包括微博在事件监测与预警、安全隐私及实时检索中的应用。然后概述了中文微博的研究现状,包括中文微博的特性及知识发现,分析了中文微博与英文微博的主要区别。最后讨论目前微博研究中存在的问题及未来中文微博的研究方向。 相似文献
8.
9.
《电子制作.电脑维护与应用》2017,(22)
借鉴了国外Twitter的采集方法,目前,国内微博信息的采集方法主要为网络爬虫采集和基于新浪微博开放平台API文档采集。但普通网络爬虫不具备登录功能,而新浪微博开放平台API有一定的限制,无法完全采集。本系统使用Java在Myeclipse平台上进行开发,使用MySQL数据库存储数据。在模拟新浪微博登录后,从数据库中获取待采集新浪微博用户的微博地址,根据获取到的地址采集网页,解析后放入数据库,供分析系统使用。 相似文献
10.
一、微博的"基础设施"微博是"微博客"(Micro Blog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,在这里用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。最早也是最著名的微博是美国的Twitter,目前其注册用户已经超过1亿,每日新增用户30万,可以说这庞大的增长数字体现了"微博"这种互联网产品的独特商业模式及强大创新能力和发展后劲。 相似文献
11.
随着在线社会网络的快速发展,越来越多的人开始利用微博或Twitter来传播信息或分享观点.研究社会网络中的信息传播规律对于意见领袖挖掘、舆情监控、品牌营销等有着重要意义.虽然有关社会网络中的信息传播模型已经得到广泛研究,但是影响网络中节点之间信息传播的因素有哪些,以及如何刻画信息传播过程,仍然是一个有待深入研究的重要内容.传统的传播模型及其扩展模型更多地从网络结构出发研究信息传播,很大程度上忽视了节点属性和信息内容的影响.从多个维度提取信息传播的特征,包括节点属性特征和信息内容特征,对节点间传播概率和传播延迟进行建模,提出一个细粒度的在线社会网络信息传播模型.利用随机梯度下降算法学习模型中的各个特征的权重.另外,针对模型的传播预测功能,在新浪微博真实数据集上进行了实验,结果表明,在预测准确率方面,所提出的模型要优于其他同类模型,如异步独立级联模型、NetRate模型. 相似文献
12.
微博在英语教学中的应用探析 总被引:2,自引:1,他引:2
信息技术的迅猛发展为教育提供了全新的教学应用模式和平台,其中Twitter是互联网Web 2.0技术下最具代表性的平台。本文基于对微博的发展及特征的理解,探讨微博在英语教学中的应用前景,认为微博可以用于英语的写作、虚拟课堂讨论、片段学习、师生交流等方面,期待微博带给教育更加广阔的天地。 相似文献
13.
14.
微博的广泛使用产生了大量微博数据,这些数据中包含有大量有价值的信息。然而由于微博信息的文本内容简短且其本身带有一些结构化的社会网络方面的信息,传统的主题模型建模方法并不能十分有效地处理微博信息。根据微博信息的特点,提出一个基于Latent Dirichlet Allocation(LDA)的微博生成模型MRT-LDA,利用微博之间的转发、对话、支持(赞)和评论等关系来计算微博之间的相关性,综合考虑微博之间的相关性和同一用户微博信息间的关系,来辅助对微博的主题进行挖掘。采用吉布斯抽样法对模型进行推导,结果表明该模型能有效地对微博数据进行文本挖掘。 相似文献
15.
随着以微博为代表的社交媒体越来越流行,谣言信息借助社交媒体迅速传播,容易造成严重的后果,因此自动谣言检测问题受到了国内外学术界、产业界的广泛关注.目前,越来越多的用户使用图片来发布微博,而不仅仅是文本,微博通常由文本、图像和社会语境组成.因此,文中提出了一种基于深度神经网络,针对配文文本内容、图像以及用户属性信息的多模... 相似文献
16.
构建了一个基于微博的网络学习社区,采用.NET技术框架和ASP.NET MVC架构设计模式,使用LINQ技术访问数据库,将学习内容以碎片的形式直观地表达出来,并通过收听和被收听机制形成学习共同体,整合学习资源、学习计划和学习主题的更新、使用和评价等信息,学习者之间以及学习者和引导者之间达到了良好的互动协作效果,对精品课程的网络学习建设具有重要的借鉴意义。 相似文献
17.
18.
为了解决谣言检测中由于缺乏外部知识而导致模型难以感知内隐信息,进而限制了模型挖掘深层信息的能力这个问题,提出了基于知识图谱的多特征融合谣言检测方法(KGMRD)。首先,对于每个事件,将帖子和评论共同构建为一个文本序列,并利用分类器从中提取其中的情感特征,利用ConceptNet基于文本构造其知识图谱,将知识图谱中的实体表示利用注意力机制与文本的语义特征进行聚合,进而得到增强的语义特征表示;其次,在传播结构方面:对于每个事件,基于帖子的传播转发关系构建传播结构图,使用DropEdge对传播结构图进行剪枝,从而得到更有效的传播结构特征;最后,将得到的特征进行融合处理得到一个新的表示。在Weibo、Twitter15和Twitter16 三个真实数据集上,使用SVM-RBF等七个模型作为基线进行了对比实验。实验结果表明:对比当前效果最好的基线,提出的KGMRD方法在Weibo数据集的Acc指标提升了1.1%;在Twitter15和Twitter16数据集的Acc指标上提升了2.2%,实验证明提出的KGMRD方法是合理的、有效的。 相似文献
19.
微博信息传播预测研究综述 总被引:1,自引:1,他引:0
微博已经逐渐成为人们获取信息、分享信息的重要社会媒体,深刻影响并改变了信息的传播方式.针对微博信息传播预测问题展开综述.该研究对舆情监控、微博营销、个性化推荐具有重要意义.首先概述微博信息传播过程,通过介绍微博信息传播的定性研究工作,揭示微博信息传播的特点;接着,从以信息为中心、以用户为中心以及以信息和用户为中心这3个角度介绍微博信息传播预测相关研究工作,对应的主要研究任务分别是微博信息流行度预测、用户传播行为预测和微博信息传播路径预测;继而介绍可用于微博信息传播预测研究的公开数据资源;最后,展望微博信息传播预测研究的问题与挑战. 相似文献
20.
杨梓艺 《网络安全技术与应用》2014,(5):12-13
计算机辅助二维碎片自动拼接是模式识别领域中的一个典型问题,它在司法鉴定、文物修复等领域有着广泛的应用.本文对这种二维图像碎片的自动拼接问题展开研究.对于仅纵切的碎片,比较任意两张图片拼接后边界处的相似度来判断碎片之间是否左右相邻;对于纵切加横切的碎片,在纵切模型的基础上考虑了碎片文字所在行的几何特征信息,解决了判断碎片上下相邻的问题;对于双面的碎片,处理方法与纵切加横切类似,仅在对行的几何特征按照相似度进行分组时需要考虑正反面的情况.实验结果验证了方案的有效性.另外,对于文字特点不同于中文的英文碎片建立了改进模型. 相似文献