首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
程婷婷  王恒山  刘建国 《计算机科学》2011,38(11):213-215,256
二分图中不存在三角形,由标准聚类系数概念扩展二分图聚类系数将其定义为四边形所占比例,提出计算聚类系数的通用公式,并证明这两个聚类系数具有同样的聚类特征。把这两个聚类系数应用于计算大尺度环数目,得到适合于一分网络或是多分网络的通用计算大环数目公式。  相似文献   

2.
提出一种基于谱聚类的协同推荐算法(SCBCF)。首先从用户——项目二分网络的单顶点投影中得到用户之间的相似矩阵,然后对该矩阵应用谱聚类算法,将用户聚成k类,并将得到的聚类结果用于数据平滑和邻居结点的选择,最后基于最近邻居集评分行为,对目标用户产生推荐。在Movie-Lens上的实验结果证明本文方法比传统的协同过滤算法能更好地应用于二分网络的协同推荐。  相似文献   

3.
用二分图来实现个性化推荐的算法越来越受到研究者的注意。文中提出混合用户模型下的二分图推荐算法(MNBI),针对二分图推荐算法中存在的用户多、项目少时命中效率低的情况用混合用户模型进行改进,同时对于推荐中加权的二分图边的权值用用户集的总体的加权和进行改进。该算法基本思想就是在用户很多的情况下,用混合用户模型对用户首先进行一个预处理生成一定数量的用户集,然后用用户集和项目构成用户集-项目的二分图。通过在Movielens数据集中进行测试的实验结果表明,相比NBI算法,MNBI算法推荐的命中效率有一定的提高,同时对于推荐多样性有所提高,并且在数据冷启动情况下效果较好。  相似文献   

4.
针对推断网络(NBI)的二分图方法中只是考虑用户是否评价过项目,却没有利用用户评分高低这一局限性,提出基于偏好的推断网络(PNBI)推荐方法。该方法在推断网络的基础上,考虑单个用户对项目评分高低体现了该用户对项目的喜好程度,在“用户-项目”的资源分配过程中,将资源分配给评分值较大的评分项,该方法能克服NBI算法中无法使用低评分值数据的缺陷。考虑到数据的稀疏性问题,采用倒排表的方法来节省相似度的运算次数,加速算法。在MovieLens数据集上的实验表明, PNBI二分图推荐算法在准确率、覆盖率和召回率三个方面均优于NBI二分图推荐算法。  相似文献   

5.
针对以二分图形式发布的社会网络隐私泄露问题,提出了一种面向敏感边识别攻击的社会网络二分图匿名方法。在已有k-安全分组的理论基础上,结合二分图的稀疏性和敏感边识别攻击形式,分别提出了正单向、逆单向以及完全(c1,c2)-安全性原则,并在此基础上,形式化地定义了一类抗敏感边识别攻击的社会网络二分图安全匿名问题;同时,还提出了一种基于k-频繁子图聚类的二分图划分算法和一种基于二分图(c1,c2)-安全性的匿名算法来保证发布二分图的安全性。实验结果表明,该算法在与已有方法相当时间开销的前提下,能产生更小的信息损失度,有效地抵制了敏感边识别攻击,实现了二分图的安全发布。  相似文献   

6.
张嫱嫱  黄廷磊  张银明 《计算机应用》2015,35(12):3511-3514
针对二分网络中社区挖掘的准确性不高、对额外参数的依赖较大的问题,基于谱聚类算法的思想,从二分网络的拓扑结构展开,提出了一种改进的社区挖掘算法。该算法将二分网络映射到单一网络进行社区挖掘,采用资源分布矩阵替代传统的邻接矩阵,挖掘出同类节点间的隐含信息,有效地保证了原图的信息,改进了谱聚类算法的输入,提高了社区挖掘的准确性;将模块度函数概念应用到聚类分析中,用模块度衡量社区挖掘的质量,有效解决了自动确定聚类数目的问题。在实际网络和人造网络上进行实验,与蚁群优化算法、边集聚系数算法等算法进行对比,实验结果表明,所提算法不但能较准确地获得二分网络的社区数目,且在不需要任何额外参数的情况下,能获得很好的划分效果,可以应用于深入理解二分网络,进行推荐、影响力分析等。  相似文献   

7.
二分网络是复杂网络的表现形式之一,二分网络单侧节点的社区划分对研究复杂网络具有重要的实际意义.基于信息在网络中的扩散概率和模块度思想,本文提出了一个针对二分网络的社区划分聚类算法(IPS算法).该算法通过模拟信息在网络中扩散的过程,利用各个节点的信息量在网络中扩散后,每个节点收到其他节点的信息量作为社区之间合并的依据,并引入二分网络模块度作为社区划分优劣判断的依据.最后算法在典型网络上测试结果表明,该算法不仅能够精确的识别二分网络社区个数,而且可以获得高质量的社区划分结果.  相似文献   

8.
协同过滤是推荐系统中广泛使用的最成功的推荐技术,但却面临着严峻的稀疏性问题.评分数据稀疏性使得最近邻搜寻不够准确,导致推荐质量较差.使用二分图网络缓解协同过滤推荐系统中的稀疏性问题,即将用户和项目抽象为二分图网络中的节点,重新分配项目资源并计算项目间资源贴近度,据此填充用户未评分项目,将稀疏评分矩阵转化为完全矩阵.采用近邻传播聚类对评分矩阵进行聚类,提高算法的可扩展性.最后提出了两种不同的在线推荐策略:(1)通过加权目标用户所在类的邻居用户评分产生推荐(BNAPC1);(2)通过各个类的总体偏好产生推荐(BNAPC2).在MovieLens和Netflix数据集上进行了实验,结果表明BNAPC1的预测精度优于BNAPC2,且与其他几种常用的推荐算法相比仍具有一定优势.  相似文献   

9.
弹性网络算法是一种启发式算法,最初被提出是用来解决TSP(Traveling Salesman Problem)问题的,现如今,被广泛应用于聚类问题中,尤其对于高维空间数据聚类方面,有很大的优势。提出了一种新的自适应弹性网络算法(Adaptive Elastic Net,AEN)解决聚类问题,该算法利用弹性网络算法得到的[K]个中心点作为聚类初始中心点,并利用局部搜索择优算法在每次迭代中更新中心点。以聚类完成后每一簇的中心点到该簇元素的距离之和作为聚类质量评价标准,分别对随机生成的不同维度的50,100,300,500,1?000个数据点的数据集和UCI中多个标准数据集进行聚类,并将结果与传统聚类算法的聚类结果进行比较。实验表明:相较于传统的聚类算法,该算法可以有效地提高聚类质量。  相似文献   

10.
准确而积极地向用户提供他们可能感兴趣的信息或服务是推荐系统的主要任务。协同过滤是采用得最广泛的推荐算法之一,而数据稀疏的问题往往严重影响推荐质量。为了解决这个问题,提出了基于二分图划分联合聚类的协同过滤推荐算法。首先将用户与项目构建成二分图进行联合聚类,从而映射到低维潜在特征空间;其次根据聚类结果改进2种相似性计算策略:簇偏好相似性和评分相似性,并将二者相结合。基于结合的相似性,分别采用基于用户和项目的方法来获得对未知目标评分的预测。最后,将这些预测结果进行融合。实验结果表明,所提算法比最新的联合聚类协同过滤推荐算法具有更好的性能。  相似文献   

11.
近年来,生成图模型在复杂网络研究中的作用越来越重要。图的生成过程对于研究疾病的蔓延和信息的传播具有重大意义,同时图模型的生成也有助于更深入地研究复杂网络的特性。为了能够生成既符合真实网络特征又具有结构多样性的复杂网络,提出了一种具有社区结构的可调节聚集系数和模块性的无标度网络生成算法——TCMSN(Scale Free Network with Tunable Clustering Coefficient and Modularity)。通过调节混合参数可以调节生成网络的模块性,通过调节社区内连边的概率和混合参数可以对网络聚集系数进行调节。TCMSN采用了合理的连边策略,在不破坏网络结构多样性的情况下,能尽可能维持网络的无标度特性。人工构造数据和真实网络数据的对比实验结果表明,TCMSN算法能够生成可调节聚集系数和模块性的无标度网络模型,且能够生成最接近真实网络社区结构特征的网络模型。  相似文献   

12.
Gradient-based methods, including Normal Boundary Intersection (NBI), for solving multi-objective optimization problems require solving at least one optimization problem for each solution point. These methods can be computationally expensive with an increase in the number of variables and/or constraints of the optimization problem. This paper provides a modification to the original NBI algorithm so that continuous Pareto frontiers are obtained “in one go,” i.e., by solving only a single optimization problem. Discontinuous Pareto frontiers require solving a significantly fewer number of optimization problems than the original NBI algorithm. In the proposed method, the optimization problem is solved using a quasi-Newton method whose history of iterates is used to obtain points on the Pareto frontier. The proposed and the original NBI methods have been applied to a collection of 16 test problems, including a welded beam design and a heat exchanger design problem. The results show that the proposed approach significantly reduces the number of function calls when compared to the original NBI algorithm.  相似文献   

13.
陈崚  邹凌君  屠莉 《计算机应用》2007,27(8):1976-1979
针对当前对多条数据流的聚类算法不能兼顾质量和效率的矛盾,提出了基于相关系数的多条数据流的聚类算法,实现固定长度的在线动态聚类。算法引入衰减系数提高聚类质量,以相关系数作为流数据间相似度的度量标准,将数据流划分若干个数据段,以各数据流的相关统计信息进行聚类,得到实时的聚类结构。实验结果表明,算法有较高的效率、聚类质量和稳定性。  相似文献   

14.
针对处理高维海量数据时聚类算法用时太长的问题,提出基于抽样的多模态分布聚类优化算法,该算法随机地抽取少量样本进行循环校正,减少聚类时间,通过大量实验找出算法的最优配置参数,结果证明,该优化算法以11.8%的聚类运行时间得到了88%的聚类准确性,为高时间成本的应用环境提供了最优的聚类方案。  相似文献   

15.
传统的聚类算法不适用于处理海量和高维数据。针对云计算环境下,利用集群系统的并行计算能力,实现海量数据的聚类问题,给出了云计算环境下基于分形维数的聚类融合算法。该算法首先对基于分形维数的聚类算法进行改进,使之更适用于并行计算,其产生聚类作为初始聚类成员;再结合投票算法的融合策略实现融合。最后,对基于分形维数的聚类融合算法在云计算环境下实现并行计算。通过在UCI数据集上的对比实验来验证该算法的有效性。  相似文献   

16.
针对FCM(Fuzzy C-Means)算法在图像分割时存在选取初始聚类中心不佳与算法抗噪性差的问题,提出一种融合空间信息的改进FCM图像分割算法;首先采用了直方图算法和LOF(Local Outlier Factor)算法自适应地选取初始聚类中心,之后使用马尔科夫随机场得到先验概率改进目标函数,使用修正隶属度矩阵的方法改进算法流程,最后使用改进算法进行图像分割;为验证该算法性能,使用Berkeley图像数据集作为实验数据,选取Dice系数、JS系数、SA系数、PSNR指数、运行时间及迭代次数作为评价标准;实验结果表明,该算法能够获取更优初始聚类中心,在处理不同噪声图像上有更好的鲁棒性。  相似文献   

17.
扩散映射(diffusion maps)是一种基于流形学习的非线性降维方法。为了提高降维的效果, 根据近邻点的选取对diffusion maps的降维效果影响, 利用数据近邻点分布的不同, 挖掘该数据点局部的密度信息, 能够更好地保持数据的流形结构。利用样本点聚类后的类别信息构造密度信息指数, 提出了一种改进的diffusion maps算法, 有效地保持了高维数据中的流形结构, 所提的新算法在多种实验中得到了证实。  相似文献   

18.
陈岩  赵笃 《计算机仿真》2006,23(10):100-102,118
扩频技术在新兴的个人无线通信中得到了广泛的应用。由于可用频带的限制,扩频通信系统要与现有的窄带通信系统共享相同的频带,而且扩频信号的幅度相对于窄带信号的幅度要小很多。尽管扩频通信系统自身具有抗窄带干扰的能力,但当存在窄带干扰的时候,有效的窄带干扰抑制技术可以提高系统性能。该文主要对最小均方误差检测技术抑制窄带干扰进行了研究,分析了其性能及自适应算法的实现。仿真结果证明,应用最小均方误差检测可以有效地对抗数字窄带干扰。  相似文献   

19.
提出一种密度敏感模糊核最大熵聚类算法.该算法首先通过核函数将原始非线性非高斯的数据集转化为核空间数据集,然后利用核函数的相似性抵消不属于该聚类的样本数据在聚类过程中对聚类中心求解的干扰,消除正则化系数对聚类结果的影响,进而抑制传统最大熵聚类算法的趋同性.最后通过引入相对密度项,解决因样本数据在特征空间的分布差异而导致的聚类中心求解偏差问题,从而提高聚类结果的准确性.实验部分,本文讨论了算法参数间的关系以及对聚类结果的影响.通过与传统模糊C均值聚类算法、核模糊C均值聚类算法、最大熵聚类算法、最大熵规范化权重核模糊C均值聚类算法以及其他两种改进最大熵聚类算法的聚类结果进行对比分析,结果表明本文提出的密度敏感模糊核最大熵聚类算法的聚类性能明显优于其他算法.  相似文献   

20.
随着数据维度的增加,传统聚类算法会出现聚类性能差的现象.SubKMeans是一种功能强大的子空间聚类算法,旨在为K-Means类算法搜索出一个最佳子空间,降低高维度影响,但是该算法需要用户事先指定聚类数目K值,而在实际使用中有时无法给出准确的K值.针对这一问题,引入成对约束,将成对约束与轮廓系数进行结合,提出了一种基于成对约束的SubKMeans聚类数确定算法.改进后的轮廓系数能够更加准确的评价聚类性能,从而实现K值确定,实验结果证明该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号