首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
随着Web 2.0时代的发展,微博作为新兴的社交网络媒体在人们的日常生活中扮演着愈发重要的角色.它不仅是用户交流与分享信息的桥梁,也是获取信息的重要方式.微博同时具有社交网络与信息媒体双重性,其生态环境中仅具有媒体属性,用于发布信息给公众的自媒体账号(we media account)发展迅速.首次提出微博自媒体账号识别这一研究问题,阐述了自媒体账号识别对分析微博生态环境、用户兴趣建模、优质内容挖掘的重要意义,提出了结合个人信息、账号行为及微博内容3类特征的有监督识别方法.研究结果表明:1)自媒体账号与普通的微博账号有着较明显的不同,主要体现在微博发布行为的规律性以及话题分布特性之上.2)提出的3类特征能够有效识别自媒体账号,不同类别的特征也能够相互补充,预测准确率高达96.71%.  相似文献   

2.
提出了一种基于主题增强卷积神经网络的用户兴趣识别的方法,通过构造一个双通道CNN模型,融合连续语义信息和离散主题信息,获取用户微博类别分布,在此基础上,通过极大似然估计识别用户的兴趣.实验结果表明,相较于基于Labeled LDA主题模型的方法和传统卷积神经网络的方法,提出的主题增强卷积神经网络缓解了噪声词对用户兴趣词的影响,并且通过融入主题信息提高了对于包含噪声词较多的微博的分类效果,在微博分类及用户兴趣识别上的效果获得了显著的提升.  相似文献   

3.
Logo检测在品牌识别和知识产权保护等领域有着广泛的应用. 针对logo检测中存在小尺度Logo检测性能差和logo定位不准的问题, 本文提出一种基于YOLOv4网络的logo检测方法, 将YOLOv4网络PANet模块中的5个连续卷积层用设计的自适应残差块替换, 增强浅层和深层的特征利用, 有侧重地进行特征融合, 同时优化网络训练; 并在自适应残差块之后使用坐标注意力机制, 通过精确的位置信息对通道关系和长期依赖性进行编码, 从融合的特征中过滤和增强对于检测更有用的特征; 最后采用K-means++聚类算法得到更适合logo数据集的先验框, 并分配给不同的特征尺度. 实验结果表明, 本文提出的方法在FlickrLogos-32和FlickrSportLogos-10数据集上的平均精度达到了88.09%和84.72%, 较原算法分别提高了0.91%和1.40%, 在定位精度和小尺度logo检测上的性能都显著提升.  相似文献   

4.
崔为娜 《计算机科学》2016,43(Z11):469-471
微博作为社交媒体的后起之秀,已经得到快速的发展。微博快速的发展在带给人们便利的同时,也使人们置身于信息的海洋。针对微博中日益呈现出的信息过载问题,微博分类已经成为一个重要的研究课题。针对微博分类,提出一种基于特征加权语言模型的微博分类新方法。 在新浪微博上抽取的真实标注数据集上进行的对比实验结果表明,所提方法是一个有效的微博分类方法。  相似文献   

5.
随着社交媒体的迅速发展,谣言通过社交媒体迅速传播,识别社交媒体网络上的谣言是社交网络研究中一个至关重要的问题.本文提出了一种新的考虑注意力机制的微博谣言检测模型,考虑到卷积神经网络(CNN)提取到的特征对输出结果影响力问题,在经典的文本卷积神经网络(Text CNN)上引入了注意力机制,通过CNN中的卷积层学习微博窗口的特征表示,再根据每个特征表示对输出结果的影响力不同通过注意力机制赋予不同的权重来进行谣言事件的检测.研究结果表明,本文提出的微博谣言检测模型准确率达到了96.8%,并且在召回率和F1值上也有提升,即本文提出的新的微博谣言检测模型具有更好的谣言识别能力.  相似文献   

6.
基于Hadoop的微博舆情监控系统   总被引:1,自引:1,他引:0  
随着在线社会网络如社交网站、微博、在线社区等的快速发展, 一个真正的双向传播和新媒体时代逐步形成. 在线社会网络让每个用户都能创造自己的内容, 并且快速传播出去. 据不完全统计, 新浪微博平均每秒有超过1000条的新微博产生, 日增量数据为5TB, 因此海量数据给舆情监控带来了严峻的挑战. 将介绍一种基于Hadoop的微博舆情监控系统, 能够对大规模采集数据进行挖掘、分析, 实现对舆情热点话题的发现及追踪、对微博的社会网络分析, 分析结果可视化呈现, 为党政机关、大型企业等单位和组织及时发现敏感信息、掌握  相似文献   

7.
充分挖掘微博短文本的语义以实现精准搜索是一项重要任务.由于微博文本内容具有稀疏性和语义局限性的特点,使得仅通过分析字面语义来进行短文本理解和相似性匹配的传统搜索方法受到了一定的限制.因此提出了一种社交与概念化语义结合的扩展搜索方法,通过挖掘社交网络独特的社交属性如#标签#、“@”和链接信息URL,对微博短文本实现进一步的社交语义扩展.该方法将文本字面分析获取的概念词语和社交关系中潜在的关联标签信息相结合,对短文本进行2种角度下的语义特征表示,实现了基于微博短文本语义充分理解的精准搜索.在微博数据集上的对比实验表明,与已有的扩展搜索方法相比所提方法能捕捉更多的语义特征,微博搜索的性能也得到了显著的提升.  相似文献   

8.
As a media and communication platform, microblog becomes more popular around the world. Most users follow a large number of celebrities and public medias on microblog; however, these celebrities do not necessarily follow all their fans. Such one-way relationship abounds in ego network and is displayed by the forms of users’ followees and followers, which make it difficult to identify users’ real friends who are contained in merged lists of followees and followers. The aim of this paper is to propose a general algorithm for detecting users’ real friends in social media and dividing them into different social circles automatically according to the closeness of their relationships. Then we analyze these social circles and detect social attributes of these social circles. To verify the effectiveness of the proposed algorithm, we build a microblog application which displays algorithm results of social circles for users and enables users to adjust proposed results according to her/his real social circles. We demonstrate that our algorithm is superior to the traditional clustering method in terms of F value and mean average precision. Furthermore, our method of tagging social attributes of social circles gets high performance by NDCG (normalized discounted cumulative gain).  相似文献   

9.
台标是视频的重要语义信息,其检测与识别面临类别多、结构复杂、区域小、信息量低、背景干扰大等难题.为提高模型的泛化能力,本文提出将台标图像叠加到背景图像中合成台标数据,来构建训练数据集.进一步,我们提出两阶段可伸缩台标检测与识别(scalable logo detection and recognition,SLDR)方法,其采用batch-hard度量学习方法快速训练匹配模型,确定台标类别.SLDR的检测与识别分离机制使得其可将检测目标扩展到未知类别.实验结果表明,合成数据可以有效提升模型的泛化能力和检测精度.实验亦显示SLDR方法在不更新检测模型的情况下,即可获得与端到端模型相当的精度.  相似文献   

10.
在全部微博内容中,由用户转发而产生的信息占有非常大的比例。同时,内容的转发也是微博中信息传播的主要途径。因此,用户的转发行为有着重要的研究价值,可应用于社交营销、微博检索、热点事件预测等领域中。该文中,我们通过分析所收集的大量真实的新浪微博数据,发现影响用户转发行为的一些因素: 微博作者、用户兴趣以及微博热度。基于这些发现,该文提出了一种新颖的基于LDA模型的方法,综合利用以上3个特征预测用户转发行为。为了对该方法进行评价,我们利用收集的大量的微博数据及对应的社交网络结构模拟真实用户环境。实验表明,该方法的性能优于目前最好的方法,F值比其他基线方法高出35%—45%。  相似文献   

11.
熊宇  张一飞  冯时  王大玲 《控制与决策》2019,34(7):1409-1416
作为一种重要的社会媒体平台,分析、检测并跟踪微博内重大社会事件可以及时提供舆论焦点.但因其碎片化、异构性和实时性,传统方法很难有效分析海量微博,为此,提出一种基于多模态特征深度融合的微博事件检测与跟踪框架.首先基于文本处理对微博事件进行标注;然后用多模态特征深度融合实现事件的检测与表示;最后利用基于时间平滑的图变换模型完成事件流的跟踪.在真实数据集上的实验表明,所提出的方法能有效检测和跟踪微博流事件.  相似文献   

12.
社交网络用户的指数型增长,导致用户在网络中难以找到适合自己的好友.提出一种基于多目标检测算法SSD和时序模型的微博好友推荐算法BSBT-FR,首先利用SSD对搜集到的用户图像进行信息提取,再利用时序模型在时间维度上对提取到的信息做进一步处理,然后利用JS散度公式计算用户间的相似度,最后与基于用户个人信息得出的相似度进行加权式融合,得出综合的用户相似度,使用Top-K思想进行用户推荐.在新浪微博用户数据集上的实验表明,参考因素的权重取值会影响推荐结果,BSBT-FR算法与只考虑用户属性或用户图像的算法相比,精准度更高.  相似文献   

13.
With the popular of online social network, the studies of information diffusion on social media also become very attractive direction. Knowing the influence of users and being able to predict it can be very helpful in enhancing or controlling the information diffusion process, where the identification of influential spreaders in online social network is very critical. In this paper, a novel method called SIRank is proposed to measure the spread influence of users in microblog, considering the user interaction features, retweet intervals, location of users in information cascades and other relevant features. By quantifying cascade structure influence and user interaction influence on information diffusion, the proposed methods uses random walk on microblog network, successfully ranked the users’ spread influence. Experiments were conducted on an anonymous real microblog dataset, the results shown that our method can efficiently measure the users’ spread influence, and perform better in both coverage and prediction comparison than other ranking methods.  相似文献   

14.
The ubiquitous and fast-growing e-marketplaces are causing serious concerns of unauthorized trademark usages, especially their pictorial images. There is a significant need for e-commerce service intermediaries and trading sites to actively check whether product images posted online are not infringing upon others’ intellectual property rights (IPRs). To ensure registered trademark (TM) or copyrighted logo-image (logo) protection, this research develops an intelligent system that can detect, locate, and crop (cut) logos posted online and check whether they are substantially or deceptively similar to registered TM logos. This research integrates two deep learning models to achieve the research goal. The first is the logo detection and localization model for cropping trademark like images from complex online merchandise photos, which could have images of many product views and even worn and displayed on a human model. Only the cropped logo image is needed for comparison to a database of registered trademarks. The second model performs TM similarity analysis using the cropped logos compared to the published TM images. Yolo v4 is adopted as the general logo locator for intelligent logo image cropping. The triplet convolutional neural network model is used to fine-tuned for intelligent trademark similarity analysis. The models are trained with an image dataset, combining image samples from LogoDet-3k and images found through web search. The system performance is quantitatively tested using the FlickrLogos-32 dataset and consumer product images extracted from an e-commerce platform. The test results of the system achieve high precision (0.91) for trademark class matching.  相似文献   

15.
Wang  Yanmei 《Multimedia Tools and Applications》2020,79(27-28):19151-19166

Microblog (such as Weibo) is an integrated social platform of vital importance in the internet age. Because of its diversity, subjectivity and timeliness, microblog is popular among public. In order to perform sentiment classification on microblog posts and overcome the limitation of text information, a fine-grained sentiment analysis method is proposed, in which emoticon attributes are considered. Firstly, the microblog texts are pre-processed to remove some stop words and noise information such as links. Then the data is matched in the sentiment lexicon, and when the first matching succeeds, the second matching is performed in the emoticon dictionary. The emoticons in the emoticon dictionary are transformed into vector form. Through these matching, the emotional features are vectorized and other text features are considered. Finally, the iterative-based naive Bayesian classification method is used for sentiment classification. The experiment results show that emoticons have obvious effect on facilitating the sentiment classification of microblog posts, and the proposed sentiment classification method achieved better than average results in term of classification accuracy compared with state-of-art techniques.

  相似文献   

16.
该文主要研究在微博社交网络中怎样评价用户的影响力。在影响用户影响力的众多因素中,该文认为用户的传播能力越强,用户的信息便可以更快地在网络中扩散,其影响力也越大。和传统的用户影响力评价方法相比,该文综合考虑用户的活跃度和用户所发微博质量两个方面的因素,得到用户的影响力权重,然后把每一个用户作为社交网络中的节点,计算其在社交网络中的影响力。通过在公开语料集和真实数据中的实验,表明该方法是可行的,比传统的用户影响力评价方法更能客观、真实地反映用户的实际影响力。  相似文献   

17.
为了有效地分析意见领袖在微博在线社交网络传播中所起的作用及微博信息传播的生命周期,提出了一种OLL分级意见领袖模型。首先,爬取微博数据,并进行数据统计分析;其次,将传播力构建为转发数、活跃度与粉丝量3个因素相关的函数,并建立一种基于层次分析的权重计算方法;最后, 利用计算的传播力并结合OLL模型,对意见领袖传播作用及微博生命周期进行了实验分析。仿真结果表明:意见领袖在微博信息传播中有很强的传播效应,通过计算得出OLL模型仿真与3组真实数据的误差分别为9.6%,13.4%,4.5%,从而证明了所提OLL模型对于分析意见领袖在微博信息传播中的生命周期是合理且有效的。  相似文献   

18.
基于MB-LDA模型的微博主题挖掘   总被引:5,自引:0,他引:5  
随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本身带有一些结构化的社会网络方面的信息,传统的文本挖掘算法不能很好地对它进行建模.提出了一个基于LDA的微博生成模型MB-LDA,综合考虑了微博的联系人关联关系和文本关联关系,来辅助进行微博的主题挖掘.采用吉布斯抽样法对模型进行推导,不仅能挖掘出微博的主题,还能挖掘出联系人关注的主题.此外,模型还能推广到许多带有社交网络性质的文本中.在真实数据集上的实验表明,MB-LDA模型能有效地对微博进行主题挖掘.  相似文献   

19.
微博作为新兴的社交媒体平台,越来越多的网民选择在微博上获取与分享自己感兴趣的信息。在微博日均千万级的大数据面前,分析网民对某一事件的观点与态度是一件非常有意义的工作。调研中发现,大众对单个事件的不同话题存在不同的情感分布。针对这一现象,该文提出了使用无监督学习的层次聚类排序方法和半监督学习的微博话题纠正算法两种方法,进行事件话题及其相关微博的挖掘。最后利用情感分析的相关技术,达到对相关微博进行情感分布统计及其原因分析的目的。通过在人工构建的数据集上测试,结果表明该方法能够准确分析事件情感分布的原因。  相似文献   

20.
针对微博文本以实现谣言检测为目标,深度挖掘微博正文内容的语义信息,并且着重强调用户在微博评论中体现的情感倾向性,提升谣言识别效果。为提高谣言检测的准确率,采取基于XLNet的词嵌入方法,使用Transformer的Encoder的模型提取微博正文内容的语义特征,并结合BiLSTM+Attention网络实现微博评论的情感特征的提取,将2种特征向量进行拼接融合,进一步丰富神经网络的输入特征,之后输出微博事件的分类结果,进而实现微博谣言检测。实验结果显示,该模型对谣言识别的正确率达到94.8%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号