首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 125 毫秒
1.
针对传统社区发现方法大多基于链接或主题关系, 且没有考虑获取微博用户社会信息时的限制, 无法有效识别微博中多个社区的问题, 提出了一种综合基于主题和链接分析的微博社区发现算法来挖掘微博中多个社区。算法首先研究微博用户的链接及博文主题特性, 定义了链接相关度和主题相关度公式; 然后推出用户总相关度公式, 以此来计算节点间的传递概率, 用改进后的标签传递算法对用户分类; 最终划分出兴趣相似且社会联系紧密的用户群。真实数据集上的仿真实验验证了该方法的合理性和有效性。  相似文献   

2.
随着微博的迅速发展和大量普及, 微博社区发现已经成为新兴的研究热点. 发现网络社区有助于运营商理解网络结构和用户特征, 为用户提供个性化服务. 目前有关社区挖掘的研究大多只关注于网络结构, 忽略节点内容. 本文综合考虑网络结构和节点内容, 提出一种基于用户主题相似性和网络拓扑结构的微博社区发现方法. 首先从微博文本中抽取用户主题, 然后结合用户之间的链接关系, 对它们进行基于相似性的聚类, 最终获得社区结构. 在真实数据集上的实验证明: 所提出的方法不但能够发现潜在社区, 而且还能获知社区主题.  相似文献   

3.
提出了一个用于微博网络社区发现的模型WB-MMSB,该模型考虑了微博网络中节点存在的单向关系,节点的社区隶属度从链入主题隶属度和链出主题隶属度两个方面表示。用指数族分布和平均场变分推理方法推导了模型中各变量的表示,并用SVI算法计算模型涉及的参数。实验在新浪微博数据集上进行,采用归一化互信息和困惑度进行评估,结果表明,WB-MMSB模型的社区发现能力优于aMMSB模型,并且其收敛速度快于aMMSB模型。  相似文献   

4.
在舆情分析、微博营销和个性化推荐等方面,微博社区发现的研究都具有重要的应用价值。为了准确而有效地发现微博社交网络中的社区,提出一种基于信任关联度的微博社区发现算法(TRKM算法)。该算法通过微博用户的评论、转发、原创微博等属性来构造节点间信任关联度,再利用微博社区的模块度对网络社区划分效果进行评价。在新浪微博明星和普通用户数据集上进行实验,并将TRKM算法与传统K-means算法作比较。实验表明,该算法能够更有效地发现微博用户关系网络中的社区结构。  相似文献   

5.
基于动态主题模型融合多维数据的微博社区发现算法   总被引:1,自引:0,他引:1  
随着微博用户的不断增加,微博网络已经成为用户进行信息交流的平台.针对由于博文长度受限,传统的社区发现算法无法有效解决微博网络的稀疏性等问题,提出了DC-DTM算法.DC-DTM算法首先将微博网络映射为有向加权网络,网络中边的方向反映结点之间的关注关系,利用提出的DTM模型计算出结点之间的语义相似度,并将其作为节点间连边的权重.DTM模型是一种微博主题模型,该模型不仅能够挖掘博客的主题分布,而且能计算出某一主题中用户的影响力大小.其次,利用提出的复杂度低的标签传播算法WLPA进行微博网络的社区发现.该算法的初始化阶段将影响力大的用户结点作为初始结点,标签按照结点的影响力从大到小进行传播,克服了传统标签传播算法的逆流现象,提高了标签传播算法的稳定性.在真实数据上的实验表明,DTM模型能很好地对微博进行主题挖掘,DC-DTM算法能够有效地挖掘出微博网络的社区.  相似文献   

6.
微博网络中的每一个节点代表一个微博用户,微博用户之间除了存在一定的社会关系外,用户本身也具有一定的特性。用户之间明显的链接关系可以为社区发现提供重要的线索,但两个用户之间如果有相似的兴趣,那么即使用户之间没有明显的链接关系他们也可能加入到同一个社区,而传统的社区发现方法大多基于单个方面进行考虑。所以,提出一种结合链接分析和用户兴趣的微博社区发现方法。真实数据集上的仿真实验验证了该方法的合理性和有效性。  相似文献   

7.
基于分析微博社交网络用户之间关系,提出了一种适用于微博的社区发现方法。实验表明这种方法能够有效地发掘微博社交网络中的社区结构。  相似文献   

8.
周小平  梁循  张海燕 《软件学报》2014,25(12):2808-2823
在微博市场营销、个性化推荐等应用中,发现兴趣和网络结构双内聚的用户社区起着至关重要的作用。现阶段,绝大多数的用户社区发现算法往往将用户联系与用户内容相隔离,从而导致其社区发现结果不够合理,而少数综合用户联系和内容的用户社区发现算法较为复杂;LCA 算法是重叠社区发现算法中算法效率较高且社区质量较好的算法,然而,其在聚类时未考虑边的真实兴趣体现。针对这些问题,构建了以关注关系为网络节点、以关注关系之间是否有共同用户为关注关系潜在的边、以关注关系所关联用户的兴趣集的交集为关注关系的兴趣特征,构建微博网络 R-C 模型,并探讨了其进行微博用户社区发现的方法,分析了该方法的复杂度。最后,以新浪微博数据集为实验,对照节点CNM算法和LCA算法,从兴趣内聚和网络结构内聚两方面进行分析,发现该方法能够发现更好的微博用户社区。  相似文献   

9.
首先在分析微博文本特点的基础上设计了一种垃圾微博的过滤算法;针对微博数据稀疏性这一问题,利用社区内部联系紧密的特性,提出了微博评论树的概念和一种话题热度评价模型.最后基于以上两点提出了一种微博社区热门话题检测方法.真实数据集上的实验表明了过滤的必要性和所提出的微博社区热门话题检测方法的有效性.  相似文献   

10.
针对高维、稀疏的中文微博数据, 提出一种多步骤的新闻话题发现方法。首先结合微博的传播特点, 选取出不同时间窗口中具有较高新闻价值的微博文本; 再利用隐主题模型挖掘微博内容中隐含的主题信息, 并在此基础上进行文本聚类; 最后使用频繁项集挖掘技术获取话题关键词集合。该算法能够较好地实现对中文微博数据的降维与话题发现。真实的微博数据集实验结果验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号