首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 162 毫秒
1.
虚拟学习社区是传统教育突破空间资源限制形成的便捷性学习环境,其中意见领袖是构成社区信息通路的重要角色,对其他用户有强大的影响力。为了准确识别社区中的意见领袖,构建出虚拟学习社区网络,分析各用户的中心性和社会网络角色特征,选取入度、出度、介数、特征向量中心性、用户活跃度、用户帖子转发量、用户帖子评论量等七个特征值作为筛选条件,结合基于K-means的用户聚类算法,提出基于K-means算法的意见领袖识别模型。最后,将该识别模型应用于某虚拟社区,根据各个聚类子类的特征向量,提取理论意义上的意见领袖集合。实验证明,获取意见领袖集合具有很高的准确性,识别出的意见领袖均处于中心者或桥梁位置,占据着社会网络的优势位置,在虚拟社区中承担着核心或中介等特殊作用。  相似文献   

2.
为进行论坛舆情分析,提出一种基于标题聚类的舆论领袖发现算法。按时间将数据进行预处理,运用话题模型度量标题数据并依此进行标题聚类;建立同一话题下的变规模用户回复关系网络,结合情感分析和网络特性分析进行影响力排名以提取舆论领袖。该算法旨在快速发现某一网络热门事件中的舆论领袖,综合考虑了帖子的话题属性、情感倾向和网络结构关系。通过实验验证了该模型的可行性和有效性。  相似文献   

3.
肖宇  许炜  夏霖 《计算机科学》2012,39(2):34-37,46
意见领袖对网络舆情的产生和发展有着重要的指引作用,挖掘和识别网络社区中的意见领袖有重要的现实意义。结合聚类算法和分类算法的优势,提出一种基于话题内容分析的兴趣团体发现方法,以有效识别出兴趣团体。并通过分析用户回帖情感倾向来计算用户间链接的权重。在此基础上,提出了一种新的LeaderRank意见领袖发现算法,通过实验证明该算法能有效提高意见领袖挖掘的准确度。  相似文献   

4.
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。  相似文献   

5.
提出一种结合用户关系与用户属性的挖掘方法.根据微博特征构建微博用户关系网,采用小世界网络理论确定用户的中心性,以此获得基于用户关系的候选意见领袖.通过分析微博用户属性,建立意见领袖影响体系,提出D-means聚类算法,获得基于用户属性的候选意见领袖,结合2种候选意见领袖得到最终意见领袖.实验结果验证该方法在挖掘意见领袖上比现有方法更加准确有效.  相似文献   

6.
基于群体智能与K-均值相结合的关键帧提取*   总被引:2,自引:1,他引:1  
为了从不同类型的视频中有效地提取关键帧,提出基于群体智能与K-均值相结合的关键帧提取方法。该方法首先提取视频的颜色特征向量,利用基于群体智能的聚类方法自组织地对颜色向量进行聚类,得到初始聚类;然后通过K-均值对初始聚类进行优化并加快算法收敛,得到最终聚类;最后,提取每类中距离聚类中心最近的向量对应帧并将其作为关键帧。实验表明,该算法能有效地提取出代表视频内容的关键帧,对镜头的相似性和连续性反映准确。  相似文献   

7.
提取区间型数据的特征值,给出适用于区间型数据模糊聚类的FCM算法族(IFCM)。该算法适用于不同特征样本数据的模糊聚类运算,并可对聚类结果进行优化。聚类效果的仿真比较表明,IFCM聚类的平均失真度比基于欧氏距离的FCM聚类算法低6.81%。由于距离定义的合理性,IFCM可以根据区间型数据的不同特点调整特征值的聚类权重,并推广至多维类型数据的模糊聚类。  相似文献   

8.
点击流数据是分析互联网用户心理倾向的关键,互联网用户的聚类可以通过分析点击流数据实现. 本文提出了一种基于向量的相似度计算方法,将点击流数据转化为向量数据. 通过对向量的计算来得出聚类的结果. 算法克服了传统的聚类算法的一些缺点,更能符合研究人员研究Web点击流数据时关于个性化聚类的要求.  相似文献   

9.
计算机舌诊系统中,点刺和瘀血点是重要的舌象。基于斑点检测、支持向量机(SVM)和K-均值聚类算法,提出了对舌诊图像中点刺和瘀点的识别及提取方法。首先利用SimpleBlobDetector斑点检测算法检测斑点,并提取出斑点数量、大小和分布等特征值生成特征向量,再使用SVM进行点刺(瘀点)舌象识别。点刺(瘀点)提取同样基于斑点检测算法,提取斑点颜色特征,使用K-均值聚类将斑点聚类为多个小类簇,定义基于加权颜色空间距离的判别函数,将聚类结果同第一次斑点检测的结果对比,得到正类和负类,最终提取出点刺和瘀点。利用该方法进行实验,识别正确率达到97.4%,提取误检率为6.0%,漏检率为10.1%,表明了本方法的有效性和应用价值。  相似文献   

10.
网络舆论形成过程中,其走向很大程度上受到意见领袖的影响.由于网络舆论的影响力不断增大,国内外学者也开始把研究重点放在网络论坛意见领袖上.从论坛帖子数据中提取回复关系,映射为发帖者和回帖者之间的关联关系,从而构造出一个社群网络.某个体的入度说明其被关注的程度,局部中心度直观地反映出与某个体直接联系的个体数目.基于入度和局部中心度的思想,并分析个体之间的交互行为,提出一种在线论坛的意见领袖发现算法.以某论坛为实验对象,找出其中的意见领袖,并通过分析实验结果验证文中算法的正确性  相似文献   

11.
面向网络论坛的高质量主题发现   总被引:4,自引:0,他引:4  
陈友  程学旗  杨森 《软件学报》2011,22(8):1785-1804
提出了一种通用的高质量主题发现框架.在该框架下,利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题.提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,用来评价被抽取特征的重要性.在腾讯论坛数据集上进行了大量的实验.实验结果表明,该框架能够很好地发现高质量主题.提出的特征抽取算法、特征选择算法以及高质量主题发现框架能够在很多Web2.0领域得到应用,例如,博客、社会网络平台等.  相似文献   

12.
在线论坛中包含了大量的有用信息,通过检索论坛中的数据用户可以方便地获取所需的知识,然而论坛数据的层次特征给内容检索提出了严峻的挑战。本文针对论坛数据的层次特征,提出了一种基于层次评分函数的多粒度搜索方法。首先,将论坛数据用树形层次结构表示,并基于多个因素提出了融合话题、发言、语句和单词多个粒度的层次评分函数。接下来,为了避免多种粒度的数据在返回结果中具有重复性,提出了一种有约束的返回结果最大化模型。最后,将返回结果最大化模型转化为最大独立集合问题,并给出了一种启发式优化算法。实验表明,本文提出的算法在检索论坛数据时不仅具有很好的效率,而且准确性非常高。  相似文献   

13.
Online forums are rich sources of information about user communication activity over time. Finding temporal patterns in online forum communication threads can advance our understanding of the dynamics of conversations. The main challenge of temporal analysis in this context is the complexity of forum data. There can be thousands of interacting users, who can be numerically described in many different ways. Moreover, user characteristics can evolve over time. We propose an approach that decouples temporal information about users into sequences of user events and inter-event times. We develop a new feature space to represent the event sequences as paths, and we model the distribution of the inter-event times. We study over 30,000 users across four Internet forums, and discover novel patterns in user communication. We find that users tend to exhibit consistency over time. Furthermore, in our feature space, we observe regions that represent unlikely user behaviors. Finally, we show how to derive a numerical representation for each forum, and we then use this representation to derive a novel clustering of multiple forums.  相似文献   

14.
随着互联网的发展,网络论坛中蕴涵着数量巨大且质量较好的知识资源。因此对论坛信息进行有效地检索具有重要应用价值。该文研究适合于论坛数据的检索模型,以期能够充分利用论坛平台累积的海量数据来满足用户的信息需求。针对论坛页面和普通新闻页面的区别,该文提出关键帖抽取算法和论坛线索重构算法来选择论坛中信息含量丰富的帖子,并利用得到的帖子构建检索系统。实验表明该文提出的方法能够有效地提升论坛检索系统的效果。  相似文献   

15.
Cyberbullying is a growing concern in online communications. Cyberbullying has negative impacts such as distress or suicide of a victim. One common type of cyberbullying attack utilizes aggressive forum posts to insult or threaten a victim. Automated tools to classify cyberbullying may aid in avoiding or reducing the negative impacts of cyberbullying. One approach to produce an automated tool is to identify features of forum posts which may be indicators of cyberbullying. One feature of a forum post is the role of the author of the forum post, such as a bully, victim, or defender. Another feature is whether the forum post insults or threatens an individual (e.g., contains insults directed at a victim). Attackers may use aggressive forum posts to attack someone and defenders may use aggressive forum posts to retaliate against attackers. Another feature is whether the communication is anonymous (e.g., sending forum posts with no identifier) since cyberbullies utilize anonymity to reduce the ability of the victim to defend themselves and to shield the cyberbully from social consequences. In this paper, forum posts were labeled in an online forum for these features. Text matching techniques had some success in identifying aggressiveness forum posts including both attacks and defends. Anonymity of forum posts (i.e., forum posts with no identifier) was identified as a criterion to distinguish attackers (more anonymous relative to non-aggressive communications) from defenders (less anonymous relative to non-aggressive communications).  相似文献   

16.
基于协同过滤的网络论坛个性化推荐算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种基于协同过滤的网络论坛个性化推荐算法,根据用户的发帖、回帖、阅读等记录,采用加权方法计算用户帖子的评分矩阵,获取邻近用户集合,通过邻居用户的帖子评分,计算目标用户的帖子预测评分,推荐预测评分最高的帖子。实验结果表明,该算法的推荐质量较高。  相似文献   

17.
在众多的网络应用中,网络论坛的发展也是非常迅速的,针对不同的人群的不同的兴趣爱好总会有某些论坛的某些讨论区是我们感兴趣的。可是论坛复杂的结构对于新的用户来说,如何找到正确的讨论区发帖成了一件耗时的问题。本文通过研究复杂网络的相关理论,针对该问题提出了一种讨论区发帖的分类推荐算法,并经过验证和测试,证明该算法是行之有效的,可以给被该问题困扰的用户提供有用的帮助。  相似文献   

18.
An algorithm is presented in this paper to facilitate the exploration of large image collections based on visual similarities. Starting with an unordered and unannotated set of images, the algorithm first extracts the salient details into feature vectors using both color and gradient information. The feature vectors are then used to train a self-organizing map which maps high-dimensional feature vectors onto a 2D canvas so that images with similar feature vectors are grouped together. When users browse the image collection, an image collage is generated that selects and displays the most pertinent set of images based on which portion of the 2D canvas is currently in view. Flowing from an overview to details is a seamless operation controlled simply by pan and zoom, with representative images selected in a consistent and predictable way. To make organizing larger image collections practical in interactive time, the organization algorithm is designed to run in parallel on graphics processing units. Overall this paper presents an end-to-end solution that facilitates the surfing of image collections in a fresh way.  相似文献   

19.
传统的矩阵因子分解模型不能有效提取用户和物品特征,而基于深度学习模型可以很好地提取特征信息。当前,主流的基于深度学习推荐算法只是单一地将神经网络的输出或物品特征与用户特征乘积的形式来做推荐预测,不能充分挖掘用户和物品之间的关系。基于此,本文提出一种基于文本卷积神经网络与带偏置项的奇异值分解(BiasSVD)结合的推荐算法,利用文本卷积神经网络(TextCNN)来充分提取用户和物品的特征信息,然后用奇异值分解方法来做推荐,深层次理解文档上下文信息,进一步提高推荐的准确性。将该算法在MovieLens的2个真实数据集上做广泛的评估分析,推荐的准确度要明显优于ConvMF算法及主流深度学习推荐算法。  相似文献   

20.
为了解决推荐算法中无法挖掘用户深层兴趣偏好,从而导致提取准确度低下,以及相似用户聚类准确率低下时间复杂度高等问题,提出评论量化模型优化差分进化的聚类优化推荐算法(MT-QRPD)。首先利用BiGRU网络的特征时序性与CNN的强局部特征有效性联合提取评论深度特征,并利用多头注意力机制的多维语义特征筛选对评论进行深度语义特征挖掘;然后经过多层感知机非线性转换进行多特征融合完成准确量化;最后使用PCA对差分进化变异选择进行优化完成相似用户聚类优化操作,寻找相似用户完成项目推荐。通过多项实验分析表明,所提推荐算法在量化评分准确度、时间复杂度以及推荐性能上都有较好的提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号