首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
在社会网络中,标签聚类研究可以解决标签冗余和语义模糊等问题。为了提高聚类有效性,提出综合标签共现信息确定标签特征向量,通过特征向量的提取计算相似度,将传统聚类算法中用几何距离计算对象与中心对象的距离改为用皮尔森相关系数计算,提出结合K-means聚类算法对标签进行聚类的标签共现聚类算法,并分析了算法的复杂度。最后对不同聚类算法进行了相关对比实验,实验结果表明该聚类算法效果要好于其他的聚类算法,从而验证了该聚类算法的有效性和可行性。  相似文献   

2.
在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.  相似文献   

3.
提出一种基于标签正负相关性的多标签类属特征学习方法(multi-label learning with label-specific features based on positive and negative label correlation,LIFTPNL).基于k近邻的思想构建全局和局部的标签信息矩阵,根据此矩阵计算成对标签的正负相关性;对每个类别标签,基于属于相同和不同类簇的样本构建连接矩阵,联合该标签正负相关性计算样本相似度;采用谱聚类方法获得聚类中心,将原有特征转换成类属特征;通过二分类器得到分类结果.实验结果表明,所提算法优于多种多标签分类方法.  相似文献   

4.
在社交网络中,标签对资源的描述在一定程度上存在着准确性不高和结构紊乱等现象。为了改善这些问题,提出了一种新的基于权重与共现的标签凝聚型层次聚类算法:首先在社交网络中收集网页标签的相关数据,然后计算标签与网页的权重,再计算标签共现的相似度,并以此为初始数据进行凝聚型层次聚类,最后把聚类结果与人工分类结果比较,计算出精确度、召回率以及加权调和平均数F1。通过实验结果体现了这种算法的可行性。  相似文献   

5.
吴不晓  肖菁 《计算机应用》2015,35(6):1663-1667
目前多数社交网络主要根据已有好友关系推荐潜在好友,用户的兴趣爱好不作为主要考虑因素;此外,如何从大量数据中精确地提取用户的兴趣爱好是一项十分艰巨的任务。为此,提出一种在大量标注行为数据中精确挖掘出用户的兴趣爱好,并据此推荐具有相同兴趣爱好的潜在好友的算法--基于标注的好友推荐(FRBT)算法。首先使用词频-逆向文件频率(TF-IDF)对标签进行聚类,将语义相似的标签聚成话题;然后在话题的基础上提出一种新的相似度公式来计算用户相似度;再融合基于话题与基于物品的用户相似度,将相似度较高的用户作为潜在好友进行推荐。在Delicious数据集上以准确率和召回率为指标与item、tag和tri-graph三种算法进行比较,实验验证了该算法能够更准确地为用户推荐兴趣相似的好友。  相似文献   

6.
针对半监督聚类算法性能受到成对约束数量多寡的限制问题,现有的研究大都依赖于原始成对约束的数量。因此,首先提出了基于灰关联分析的成对约束初始化算法(initialization algorithm of pair constraints based on grey relational analysis,PCIG)。该算法通过均衡接近度计算数据对象间的相似度,并根据相似度的取值来确定可信区间,然后借鉴网络结构初始化方法来扩充数据对象间的成对关系。最后,将其应用于标签传播聚类算法。通过在五个基准数据集上进行实验,基于改进成对约束扩充的标签传播聚类算法与其他方法相比NMI值和ARI值有所提升。实验结果证明了改进成对约束扩充可以有效改善标签传播算法的聚类效果。  相似文献   

7.
多标签学习是分类任务中一个重要研究方向,如何保证高分类精度是关键要素。论文提出基于相似度的多标签分类算法SMLC。该算法首先构建实例相似度函数,再采用并行计算方式算出相似值,最后通过加权计算类标签集合权重或者学习阈值方法预测类标签集合。仿真结果表明,与RankSVM、ML-KNN算法对比,SMLC在多标签分类任务的多个指标上表现更优。  相似文献   

8.
基于音乐语义标签的音乐相似计算研究是音乐信息检索领域的另一个新的热点。该文提出一种基于标签挖掘的歌曲分类方法,以Last.fm音乐网站上的用户标签为特征进行歌曲相似性研究。文中将文本聚类中常用的潜在语义分析(LSA)方法和改进的K-means聚类方法相结合,应用于音乐语义标签的自动抽取;从音乐网站last.fm上抽取了6大类600首歌曲的8000多个用户标签作为音乐语义特征,并利用LSA进行歌曲向量的降维,形成了一个表示歌曲间相似关系的600×150维向量矩阵。最后利用K均值,根据音乐歌曲间的相似度进行歌曲分类,完成歌曲相似性比较。实验结果同没有LSA降维前及已有的HCC结果比较表明,使用文中提出的基于音乐标签的模型对歌曲进行分类,能得到较好的分类效果。  相似文献   

9.
目前,脑网络分类是研究热点,研究者采用不同的方法从标签数据中提取并选择特征,以实现对数据的自动分类,但是从大量的标签数据中提取和选择最优的特征很费时。针对以上问题,提出一种脑网络相似度计算方法并构建基于无偏脑网络的聚类模型。首先,使用余弦相似度和子网络核来度量脑网络的属性相似度和结构相似度,然后将结构相似度和属性相似度集成为一个相似度矩阵,最后利用谱聚类实现脑网络聚类。对openfMRI数据库中的50名精神分裂症患者与49名正常对照组进行了聚类测试,结果显示,Rand指数为0.91,精确率为0.86,召回率为0.98,F1为0.92。研究表明提出的模型能较准确地计算脑网络相似性,表现出较高聚类性能。  相似文献   

10.
刘瑛  陈清 《计算机仿真》2022,39(1):177-180,208
以提高移动终端用户个性信息挖掘性能目的,提出基于标签映射的移动终端用户个性信息挖掘方法.通过所得用户个性信息标签构成标签集合,利用标签集合表征用户个性信息并构建用户个性信息标签库,通过出现频数比设定阈值高的标签建立模糊矩阵的特征维,结合相似度计算与特征映射思想计算每一特征维上的特征值,通过模糊聚类得到不同阈值下的用户个性信息聚类结果,实现移动终端用户个性信息挖掘.实验结果表明:上述方法具有较高的挖掘准确率与较好的挖掘可扩展性,移动终端用户个性信息数据挖掘性能较好.  相似文献   

11.
一种社会化标注系统资源个性化推荐方法   总被引:2,自引:0,他引:2       下载免费PDF全文
目前许多基于社化化标注的个性化资源推荐方法均忽视了用户长短期兴趣和多义标签问题对推荐的不同影响,为此,设计区分用户长短期兴趣的指标——用户的标签偏好权重和资源偏好权重;在此基础上,提出一种结合基于内容和基于协同过滤方法优点的混合推荐方法,通过加入标注相同资源的标签向量相似度计算因子,来减小多义标签对推荐结果的影响。实验表明,将该方法引入社会化标注系统资源个性化推荐算法中,能提高推荐精度。  相似文献   

12.
为了改进当前社会化标注系统在标签浏览和检索方面的弱点,提出一种基于加权网络分割的社会性标签聚类算法。算法基于标签节点的核心度和相似性对标签共现网络进行分割,并在聚类后自动生成该类的特征标签来代表该类簇。实验测试表明算法具有较好的聚类效果。  相似文献   

13.
In social tagging system, a user annotates a tag to an item. The tagging information is utilized in recommendation process. In this paper, we propose a hybrid item recommendation method to mitigate limitations of existing approaches and propose a recommendation framework for social tagging systems. The proposed framework consists of tag and item recommendations. Tag recommendation helps users annotate tags and enriches the dataset of a social tagging system. Item recommendation utilizes tags to recommend relevant items to users. We investigate association rule, bigram, tag expansion, and implicit trust relationship for providing tag and item recommendations on the framework. The experimental results show that the proposed hybrid item recommendation method generates more appropriate items than existing research studies on a real-world social tagging dataset.  相似文献   

14.
A folksonomy consists of three basic entities, namely users, tags and resources. This kind of social tagging system is a good way to index information, facilitate searches and navigate resources. The main objective of this paper is to present a novel method to improve the quality of tag recommendation. According to the statistical analysis, we find that the total number of tags used by a user changes over time in a social tagging system. Thus, this paper introduces the concept of user tagging status, namely the growing status, the mature status and the dormant status. Then, the determining user tagging status algorithm is presented considering a user’s current tagging status to be one of the three tagging status at one point. Finally, three corresponding strategies are developed to compute the tag probability distribution based on the statistical language model in order to recommend tags most likely to be used by users. Experimental results show that the proposed method is better than the compared methods at the accuracy of tag recommendation.  相似文献   

15.
Social tagging is widely practiced in the Web 2.0 era. Users can annotate useful or interesting Web resources with keywords for future reference. Social tagging also facilitates sharing of Web resources. This study reviews the chronological variation of social tagging data and tracks social trends by clustering tag time series. The data corpus in this study is collected from Hemidemi.com. A tag is represented in a time series form according to its annotating Web pages. Then time series clustering is applied to group tag time series with similar patterns and trends in the same time period. Finally, the similarities between clusters in different time periods are calculated to determine which clusters have similar themes, and the trend variation of a specific tag in different time periods is also analyzed. The evaluation shows the recommendation accuracy of the proposed approach is about 75%. Besides, the case discussion also proves the proposed approach can track the social trends.  相似文献   

16.
赵蒙  宋俊德  鄂海红 《软件》2013,(12):136-138
随着互联网技术的发展,海量信息同时呈现,使得用户难以有效发现本身感兴趣信息,并且大量的网络暗信息少人问津,难以被普通用户获取,为了处理信息过载问题,出现了个性化用户系统,以弥补海量信息中用户很难找到有用信息的问题。而只有具备了精准的用户兴趣模型,个性化用户系统才得以真正存在。因此用户兴趣建模的研究与探索具有深远的意义。从而,本文首先介绍了社会化标签Tag系统,其次分析了用户兴趣建模的四种表示方法,最后讨论了一种基于社会化标签系统的兴趣建模方法。  相似文献   

17.
杜炤  赵灿  付小龙 《计算机工程与设计》2012,33(8):3235-3238,3261
为使校园社交网络能够准确、灵活、高效地处理大量各种类型的标签信息,研究并实现了基于校园社交网络的社会化标签系统。提出了使用五元组表示的、包含资源标签和实体标签的标签标注模型,完成了基于校园社交网络的社会化标签系统的总体设计、功能设计和数据库设计,设计了由标注对象所有者、标签标注者、校园社交网络中的关系网络与隐私设置以及标签的使用方式决定的标签标注权限与使用权限,建立了针对不同标记对象的特点使用不同标签推荐算法的标签推荐策略,最后讨论了以标签云为主的标签展示方式。  相似文献   

18.
Tagging behavior on the Internet has seen dramatic increase in recent years, and social tagging has become a popular way to organize and share resources. However, ambiguity and large quantities of tags restrict its effective use for resource searching and classifying. Tag clustering can group tags with similar semantics together, thus helping alleviate these problems. In this paper, we introduce a random walk-based method to measure relevance between tags by exploiting the relationship between tags and resources. Based on this, we also develop a novel clustering method, TagClus, which can address several challenges in tag clustering. Experimental results on a real dataset show that our methods achieve good accuracy and acceptable performance for tag clustering.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号