共查询到20条相似文献,搜索用时 162 毫秒
1.
虚拟学习社区是传统教育突破空间资源限制形成的便捷性学习环境,其中意见领袖是构成社区信息通路的重要角色,对其他用户有强大的影响力。为了准确识别社区中的意见领袖,构建出虚拟学习社区网络,分析各用户的中心性和社会网络角色特征,选取入度、出度、介数、特征向量中心性、用户活跃度、用户帖子转发量、用户帖子评论量等七个特征值作为筛选条件,结合基于K-means的用户聚类算法,提出基于K-means算法的意见领袖识别模型。最后,将该识别模型应用于某虚拟社区,根据各个聚类子类的特征向量,提取理论意义上的意见领袖集合。实验证明,获取意见领袖集合具有很高的准确性,识别出的意见领袖均处于中心者或桥梁位置,占据着社会网络的优势位置,在虚拟社区中承担着核心或中介等特殊作用。 相似文献
2.
为进行论坛舆情分析,提出一种基于标题聚类的舆论领袖发现算法。按时间将数据进行预处理,运用话题模型度量标题数据并依此进行标题聚类;建立同一话题下的变规模用户回复关系网络,结合情感分析和网络特性分析进行影响力排名以提取舆论领袖。该算法旨在快速发现某一网络热门事件中的舆论领袖,综合考虑了帖子的话题属性、情感倾向和网络结构关系。通过实验验证了该模型的可行性和有效性。 相似文献
3.
4.
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。 相似文献
5.
6.
7.
8.
9.
计算机舌诊系统中,点刺和瘀血点是重要的舌象。基于斑点检测、支持向量机(SVM)和K-均值聚类算法,提出了对舌诊图像中点刺和瘀点的识别及提取方法。首先利用SimpleBlobDetector斑点检测算法检测斑点,并提取出斑点数量、大小和分布等特征值生成特征向量,再使用SVM进行点刺(瘀点)舌象识别。点刺(瘀点)提取同样基于斑点检测算法,提取斑点颜色特征,使用K-均值聚类将斑点聚类为多个小类簇,定义基于加权颜色空间距离的判别函数,将聚类结果同第一次斑点检测的结果对比,得到正类和负类,最终提取出点刺和瘀点。利用该方法进行实验,识别正确率达到97.4%,提取误检率为6.0%,漏检率为10.1%,表明了本方法的有效性和应用价值。 相似文献
10.
网络舆论形成过程中,其走向很大程度上受到意见领袖的影响.由于网络舆论的影响力不断增大,国内外学者也开始把研究重点放在网络论坛意见领袖上.从论坛帖子数据中提取回复关系,映射为发帖者和回帖者之间的关联关系,从而构造出一个社群网络.某个体的入度说明其被关注的程度,局部中心度直观地反映出与某个体直接联系的个体数目.基于入度和局部中心度的思想,并分析个体之间的交互行为,提出一种在线论坛的意见领袖发现算法.以某论坛为实验对象,找出其中的意见领袖,并通过分析实验结果验证文中算法的正确性 相似文献
11.
12.
在线论坛中包含了大量的有用信息,通过检索论坛中的数据用户可以方便地获取所需的知识,然而论坛数据的层次特征给内容检索提出了严峻的挑战。本文针对论坛数据的层次特征,提出了一种基于层次评分函数的多粒度搜索方法。首先,将论坛数据用树形层次结构表示,并基于多个因素提出了融合话题、发言、语句和单词多个粒度的层次评分函数。接下来,为了避免多种粒度的数据在返回结果中具有重复性,提出了一种有约束的返回结果最大化模型。最后,将返回结果最大化模型转化为最大独立集合问题,并给出了一种启发式优化算法。实验表明,本文提出的算法在检索论坛数据时不仅具有很好的效率,而且准确性非常高。 相似文献
13.
Andrey Kan Jeffrey Chan Conor Hayes Bernie Hogan James Bailey Christopher Leckie 《World Wide Web》2013,16(5-6):595-620
Online forums are rich sources of information about user communication activity over time. Finding temporal patterns in online forum communication threads can advance our understanding of the dynamics of conversations. The main challenge of temporal analysis in this context is the complexity of forum data. There can be thousands of interacting users, who can be numerically described in many different ways. Moreover, user characteristics can evolve over time. We propose an approach that decouples temporal information about users into sequences of user events and inter-event times. We develop a new feature space to represent the event sequences as paths, and we model the distribution of the inter-event times. We study over 30,000 users across four Internet forums, and discover novel patterns in user communication. We find that users tend to exhibit consistency over time. Furthermore, in our feature space, we observe regions that represent unlikely user behaviors. Finally, we show how to derive a numerical representation for each forum, and we then use this representation to derive a novel clustering of multiple forums. 相似文献
14.
15.
Cyberbullying is a growing concern in online communications. Cyberbullying has negative impacts such as distress or suicide of a victim. One common type of cyberbullying attack utilizes aggressive forum posts to insult or threaten a victim. Automated tools to classify cyberbullying may aid in avoiding or reducing the negative impacts of cyberbullying. One approach to produce an automated tool is to identify features of forum posts which may be indicators of cyberbullying. One feature of a forum post is the role of the author of the forum post, such as a bully, victim, or defender. Another feature is whether the forum post insults or threatens an individual (e.g., contains insults directed at a victim). Attackers may use aggressive forum posts to attack someone and defenders may use aggressive forum posts to retaliate against attackers. Another feature is whether the communication is anonymous (e.g., sending forum posts with no identifier) since cyberbullies utilize anonymity to reduce the ability of the victim to defend themselves and to shield the cyberbully from social consequences. In this paper, forum posts were labeled in an online forum for these features. Text matching techniques had some success in identifying aggressiveness forum posts including both attacks and defends. Anonymity of forum posts (i.e., forum posts with no identifier) was identified as a criterion to distinguish attackers (more anonymous relative to non-aggressive communications) from defenders (less anonymous relative to non-aggressive communications). 相似文献
16.
17.
在众多的网络应用中,网络论坛的发展也是非常迅速的,针对不同的人群的不同的兴趣爱好总会有某些论坛的某些讨论区是我们感兴趣的。可是论坛复杂的结构对于新的用户来说,如何找到正确的讨论区发帖成了一件耗时的问题。本文通过研究复杂网络的相关理论,针对该问题提出了一种讨论区发帖的分类推荐算法,并经过验证和测试,证明该算法是行之有效的,可以给被该问题困扰的用户提供有用的帮助。 相似文献
18.
Similarity-based image organization and browsing using multi-resolution self-organizing map 总被引:1,自引:0,他引:1
Grant Strong Minglun Gong 《Image and vision computing》2011,29(11):774-786
An algorithm is presented in this paper to facilitate the exploration of large image collections based on visual similarities. Starting with an unordered and unannotated set of images, the algorithm first extracts the salient details into feature vectors using both color and gradient information. The feature vectors are then used to train a self-organizing map which maps high-dimensional feature vectors onto a 2D canvas so that images with similar feature vectors are grouped together. When users browse the image collection, an image collage is generated that selects and displays the most pertinent set of images based on which portion of the 2D canvas is currently in view. Flowing from an overview to details is a seamless operation controlled simply by pan and zoom, with representative images selected in a consistent and predictable way. To make organizing larger image collections practical in interactive time, the organization algorithm is designed to run in parallel on graphics processing units. Overall this paper presents an end-to-end solution that facilitates the surfing of image collections in a fresh way. 相似文献
19.
传统的矩阵因子分解模型不能有效提取用户和物品特征,而基于深度学习模型可以很好地提取特征信息。当前,主流的基于深度学习推荐算法只是单一地将神经网络的输出或物品特征与用户特征乘积的形式来做推荐预测,不能充分挖掘用户和物品之间的关系。基于此,本文提出一种基于文本卷积神经网络与带偏置项的奇异值分解(BiasSVD)结合的推荐算法,利用文本卷积神经网络(TextCNN)来充分提取用户和物品的特征信息,然后用奇异值分解方法来做推荐,深层次理解文档上下文信息,进一步提高推荐的准确性。将该算法在MovieLens的2个真实数据集上做广泛的评估分析,推荐的准确度要明显优于ConvMF算法及主流深度学习推荐算法。 相似文献
20.
为了解决推荐算法中无法挖掘用户深层兴趣偏好,从而导致提取准确度低下,以及相似用户聚类准确率低下时间复杂度高等问题,提出评论量化模型优化差分进化的聚类优化推荐算法(MT-QRPD)。首先利用BiGRU网络的特征时序性与CNN的强局部特征有效性联合提取评论深度特征,并利用多头注意力机制的多维语义特征筛选对评论进行深度语义特征挖掘;然后经过多层感知机非线性转换进行多特征融合完成准确量化;最后使用PCA对差分进化变异选择进行优化完成相似用户聚类优化操作,寻找相似用户完成项目推荐。通过多项实验分析表明,所提推荐算法在量化评分准确度、时间复杂度以及推荐性能上都有较好的提升。 相似文献