首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
现有的Folksonomy标签推荐系统中,标签模糊会导致系统推荐不准确,并且影响用户建模的准确性,而标签冗余妨碍了对系统的评估。利用K-Means聚类结果抽取模糊和冗余标签时,聚类效果较差导致抽取不准确。提出使用核K-Means聚类处理标签模糊和冗余,通过非线性映射能够较好地分辨、提取并放大样本中有用的特征,提高抽取模糊标签和冗余标签的准确度。实验结果表明:核K-Means聚类对标签和资源的聚类效果更好,抽取的模糊标签和冗余标签也更准确。  相似文献   

2.
现有的Folksonomy标签推荐系统使用的推荐算法没有考虑标签模糊和冗余问题,影响了用户建模和对推荐系统评估的准确性,并且降低了系统的推荐质量,增加了用户选择喜好项目时的负担。通过对标签推荐系统的研究,将标签模糊和冗余应用到标签推荐算法当中,有助于提高系统的推荐质量,并且能提供更合理的评价方法。实验结果表明:经过标签模糊和冗余处理的标签推荐算法显著地提高了推荐系统的推荐质量。  相似文献   

3.
传统K-means算法除了对初始聚类中心的选择非常敏感,易收敛到局部最优解外,还存在着K值难以确定的问题,不合适的K值往往会得到较差的聚类结果。而K值问题也是聚类分析中的一个重要的研究方向,在粒子群聚类算法的基础上,结合K-means算法,提出了自适应K值的粒子群聚类算法。当算法收敛时,可通过比较不同K值时全局最优适应度值之间的关系来决定K值的增大与减小。实验表明改进的算法可以有效指导K值的选取,并且具有较好的聚类效果。  相似文献   

4.
薛佳楣  李美珊  玄子玉 《计算机应用研究》2020,37(8):2446-2448,2454
针对利用虚假噪声应对统计攻击时可被攻击者识别的问题,对差分隐私保护模型展开研究,提出了一种基于粒子群聚类,通过真实用户位置偏移实现地理位置不可区分的隐私保护方法。该方法通过当前区域内匿名用户按照粒子群聚类的方式各自偏移,满足广义差分隐私模型的基本要求,实现地理位置不可区分。最后,通过模拟实验与同类满足广义差分隐私模型的算法进行对比分析,进一步证实了所提出的算法的执行效率和隐私安全。由此,可认为该方法具有更好的实用价值更易部署在当前应用环境。  相似文献   

5.
Represented by Flickr and Picasa, online photo albums allow users to tag images, hoping to make it more convenient as well as efficient to organize and retrieve image resources. Recently, automatic tag recommendation system has become a hot research field considering the increasing request that high-quality tags be provided. In this thesis, a new method for tag recommendation system is proposed. Unlike the traditional one which only depends on frequency information or visual feature similarity while neglecting the relation between visual content and the semantic meaning contained in tags thus leading to unsatisfactory recommendations, the new method can find out a latent subspace shared by visual features and tag contents using matrix factorization. As for an untagged image, recommendations can be made when its visual features are projected into the latent subspace and the relevance level it has with others tags is figured out. This new method has been proved efficient after being tested on NUS-WIDE data set with more satisfactory results.  相似文献   

6.
高维数据聚类是聚类技术的难点和重点,子空间聚类是实现高维数据集聚类的有效途径,它是在高维数据空间中对传统聚类算法的一种扩展,其思想是将搜索局部化在相关维中进行.该文从不同的搜索策略即自顶向下策略和自底向上策略两个方面对子空间聚类算法的思想进行了介绍,对近几年提出的子空间聚类算法作了综述,从算法所需参数、算法对参数的敏感度、算法的可伸缩性以及算法发现聚类的形状等多个方面对典型的子空间聚类算法进行了比较分析,对子空间聚类算法面临的挑战和未来的发展趋势进行了讨论.  相似文献   

7.
为解决复杂的网络信息无法对用户进行精准推荐的情况,改进传统协同过滤算法,将混沌粒子群算法与协同过滤算法融合使用.在传统粒子群算法中加入混沌扰动并随着迭代调整惯性权重,对用户进行聚类优化.获取目标用户之后,通过判断目标用户属于哪个聚类,在该聚类内部进行协同过滤计算.通过与其它算法之间的对比实验,验证了基于混沌粒子群聚类优化的协同过滤推荐算法相较其它算法具有更低的平均绝对误差和更高的准确率.  相似文献   

8.
随着社交网络的兴起,文本数据不断增加,这使得自动化文本分类技术成为研究的热点。单个文本可能同时带有多个类别标签,该特点直接导致传统的二分类或多类别分类技术在多标签文本数据上性能不佳。针对这一不足,提出一种基于半监督杂质的子空间聚类分析算法SCA(subspace clustering analysis),该算法分析在多标签环境下每一对分类和标签之间存在的潜在相关性。并设计一种对分类文本数据更有效的多标签分类器。最后,实验对两个多标签文本集进行分析,结果表明该算法优于当前采用的其他文本分类方法。  相似文献   

9.
10.
子空间聚类改进算法研究综述   总被引:1,自引:0,他引:1  
李霞  徐树维 《计算机仿真》2010,27(5):174-177
高维数据聚类是聚类技术的难点和重点,子空间聚类是实现高维数据集聚类的有效途径。CLIQUE算法是最早提出的基于密度和网格的子空间聚类算法,自动子空间聚类算法的实用性和高效性,带来了子空间聚类算法的空前发展。深入分析CLIQUE算法的优点和局限性;介绍了一些近几年提出的子空间聚类算法,并针对CLIQUE算法的局限性作了改进,聚类的效率和精确性得到了提高;最后对子空间聚类算法的发展趋势进行了讨论。  相似文献   

11.
基于稀疏表示的隐子空间聚类(latent subspace clustering,LSC)算法,相对于传统的子空间聚类算法,具有更快的聚类速度,使其适用于更大的数据集,但是其存在字典训练具有随机性,占用内存过多等缺陷。参照LC-KSVD字典训练算法的思想,通过将一部分信号的标签信息添加进字典训练阶段,以此提高了字典的判别性,进而提出了聚类精度更好的ILSC(improved LSC)算法。但相比于LSC算法,ILSC算法在字典训练阶段的耗时却大幅增加,针对此缺陷,参照增量字典训练的思想,提出了ILSC算法的增量式聚类算法I2LSC(incremental ILSC),在确保聚类精度、NMI(normalized mutual information)、RI(Rand index)值高于LSC且与ILSC相当的同时,较之ILSC具有更快的运行速度。  相似文献   

12.
吴桐  王玲  何凡 《计算机应用》2014,34(12):3526-3530
为了提高目标外观迅速变化时视觉跟踪算法的鲁棒性,提出了一种基于自适应子空间学习的粒子滤波跟踪算法。在粒子滤波构架下,建立状态判决机制,根据判决结果并结合主成分分析(PCA)子空间与正交子空间的特点,选择合适的学习方法。这样既能准确、稳定地学习到目标的低维子空间,又能迅速地学习到目标外观变化的趋势。同时,加入鲁棒估计技术处理遮挡问题,避免了对目标状态估计的影响。实验结果表明,该算法在光照变化、姿态变化、遮挡的情况下,均具有较强的鲁棒性。  相似文献   

13.
基于k最相似聚类的子空间聚类算法   总被引:1,自引:2,他引:1       下载免费PDF全文
子空间聚类是聚类研究领域的一个重要分支和研究热点,用于解决高维聚类分析面临的数据稀疏问题。提出一种基于k最相似聚类的子空间聚类算法。该算法使用一种聚类间相似度度量方法保留k最相似聚类,在不同子空间上采用不同局部密度阈值,通过k最相似聚类确定子空间搜索方向。将处理的数据类型扩展到连续型和分类型,可以有效处理高维数据聚类问题。实验结果证明,与CLIQUE和SUBCLU相比,该算法具有更好的聚类效果。  相似文献   

14.
近年来,多核聚类(MKC)在融合多源信息以提高聚类性能方面取得了显著进展。但是,以n表示样本数,O(n2)内存消耗和On3计算消耗限制了这些方法的实用性。重新设计了基于子空间分割的MKC公式,从而将其内存和计算复杂度分别降低到O(n)和O(n2)。在该算法(基于压缩子空间对齐的多核聚类算法CSA-MKC)中,通过对部分数据采样来重建整个数据集。具体而言,在该算法中,在信息融合过程中同时学习了共识采样矩阵,从而使生成的锚点集更适合于跨不同视图的数据重建。因此,改进了重构矩阵的判别性,并增强了聚类性能。此外,该算法易于并行化,通过GPU加速,在6个数据集上进行了测试,在时间上,该算法是数据规模的平方复杂度,在性能上,优于目前的先进算法。  相似文献   

15.
吴涛  陈黎飞  钟韵宁  孔祥增 《计算机应用研究》2023,40(11):3303-3308+3314
针对传统K-means型软子空间聚类技术中子空间差异度量定义的困难问题,提出一种基于概率距离的子空间差异表示模型,以此为基础提出一种自适应的投影聚类算法。该方法首先基于子空间聚类理论提出一个描述各簇类所关联的软子空间之间的相异度公式;其次,将其与软子空间聚类相结合,定义了聚类目标优化函数,并根据局部搜索策略给出了聚类算法过程。在合成和实际数据集上进行了一系列实验,结果表明该算法引入子空间比较可以为簇类学习更优的软子空间;与现有主流子空间聚类算法相比,所提算法大幅度提升了聚类精度,适用于高维数据聚类分析。  相似文献   

16.
王洁  于颜硕  周宽久  侯刚 《计算机科学》2014,41(12):197-201
Web标签有助于用户根据自己特定的兴趣完成信息资源的分类、组织和检索。然而,正是由于协同标记系统特有的公开性、自由化的特点,采用其对信息资源进行描述、组织、分类和检索,存在着信息描述不精确、标签组织混乱和标签语意模糊等问题。在此背景下提出了3种基于特征向量表示法(FVR)的Web标签SOINN聚类算法:基于资源的特征向量表示法、基于其他共现标签的特征向量表示法和基于全集共现标签的特征向量表示法。同时应用MapReduce框架将SOINN算法进行并行化。实验表明,当类中心数量超过2000时,3种分布式聚类FVR算法的召回率和准确度优于原始算法,可获得很好的加速比。从而证明此分布式聚类算法具有很好的可扩展性,可以用于更为海量的Web日志聚类分析系统。  相似文献   

17.
基于约束的粒子群聚类算法   总被引:1,自引:0,他引:1  
提出了一种基于约束的粒子群聚类算法CCPSO,该算法利用粒子群的特性在数据集中有指导地随机搜索聚类中心向量, 在较少的迭代次数内确定类别数.各样本与其类别中心的均方误差作为粒子群优化的目标函数,数据集的边界作为粒子群移动的约束条件,对约束违反分情况进行惩罚.基于数据集的方差和模糊高斯函数将样本到其类别中心的距离进行模糊映射,归一化到[0,1]区间,以降低不平衡数据集的影响.聚类iris数据集和Reuters-21578文档集以验证算法的有效性,并与k-means算法进行了对照实验,在大规模数据聚类时有明显优势.  相似文献   

18.
稀疏子空间聚类(Sparse subspace clustering,SSC)算法在处理高光谱遥感影像时,地物的划分精度较低,为了提高地物划分精度,本文提出了一种基于信息熵的加权块稀疏子空间聚类算法(Weighted block sparse subspace clustering algorithm based on...  相似文献   

19.
基于信息熵的空间对象群聚类算法   总被引:2,自引:0,他引:2       下载免费PDF全文
刘建兴  鲍培明 《计算机工程》2011,37(16):176-178
针对利用空间关系建立空间对象群聚类的问题,提出一种基于信息熵的空间对象群聚类算法ESOGC。该算法考虑空间数据的复杂性和数据之间的联系,根据邻域范围内信息熵的变化情况,捡起或放下当前空间对象群,从而实现对空间对象群的聚类。实验结果表明,该算法能解决空间对象群中对象类型、对象属性值和对象数量不一致性的问题。  相似文献   

20.
主动学习已经被证明是一种成功的机器学习算法,最主要的缺点是它只注重样本的标签信息而忽略了样本的分布信息.因此带来的后果就是稳定性差,容易陷入局部最优解,同时对初始样本的选择非常敏感.论文将稀疏子空间聚类与主动学习相结合,首先利用稀疏子空间聚类找到原始数据的分布信息,然后利用该信息指导主动学习选取初始样本,使样本标注更加有效,提高了主动学习的效率,同时降低了主动学习对初始样本的敏感度.最后通过多组仿真实验证明,本方法可以有效的改善主动学习的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号