首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近邻传播聚类算法(affinity propagation, AP)受偏向参数影响较大,很难确定最优聚类所需的参数。设计了两阶段近邻传播半监督聚类算法(two-stage semi supervised clustering algorithm based on affinity propagation, 2SAP),在整个数据集上运行半监督近邻传播算法(semi-supervised clustering based on affinity propagation, SAP),得出类代表点集合,在类代表点集合上运行SAP算法得出结果。在实际数据集上进行实验,结果证实:与算法SAP和并行近邻传播半监督聚类算法(parallel computation of semi-supervised clustering algorithm based on affinity propagation,PSAP)相比,2SAP算法的CRI和FCRI值较高,而相应的离散系数较小,说明2SAP受偏向参数的影响较小。  相似文献   

2.
针对现有聚类集成谱算法聚类结果不稳定的问题,引入近邻传播聚类思想,设计了基于近邻传播的聚类集成谱算法(APCESA).该算法先由聚类集成和谱分得到空间结构相对简单的文本低维嵌入,然后通过近邻传播算法得到最终的聚类结果.在谱分解过程中,采用矩阵变换方法,避免了谱算法中特征值分解的高昂计算代价.对真实文本数据集的实验结果表明,所提算法比对比算法聚类更稳定,且聚类结果的NMI值和ANMI值均高于对比算法.  相似文献   

3.
为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法--GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用“Gather-Apply-Scatter”的模式完成数据同步和算法迭代。在人工合成流形数据3D Clusters、Aggregation、Flame和Pathbased数据集上分别采用不同数据规模以及与传统K-means的聚类性能做对比,实验表明:基于GraphLab的近邻传播算法对数据规模具有良好的拓展性,在保持算法聚类效果的同时,有效降低时间复杂度。  相似文献   

4.
针对多维数据属性对聚类分析结果有不同重要程度影响的问题,提出一种基于自适应属性加权的近邻传播聚类算法。该方法通过考虑多维数据属性权值的重要度,在近邻传播聚类过程中引入属性加权相似性矩阵计算,并根据当前数据聚类划分的结果来分析目标评价函数,计算各个属性对当前聚类的贡献程度。随后根据贡献程度的计算结果自适应地更新属性权值,并通过属性加权相似性矩阵来重新计算近邻传播算法中的两种竞争信息,进而提高聚类结果的质量。数值实验结果表明,新方法能够有效实现属性权值的自适应调整,提高近邻传播算法的聚类效果,与其他传统聚类算法相比新方法具有更好的聚类质量。  相似文献   

5.
为了提升P2P流量的识别精度与控制效果,提出了深度学习算法的P2P流量识别与控制方法.采用P2P流量数据训练深度学习算法的BP神经网络,根据训练好的神经网络对训练样本进行预分类,得到包含各服务流量特征的预分类结果.将预分类结果作为P2P流量聚类中心值,通过聚类算法检测P2P流量样本数据,得到P2P流量识别结果.采用分形自回归综合滑动平均模型分析P2P流量控制机制.结果表明,该方法的识别性能稳定、识别结果精度较高,有效降低了流量传输的丢包率,可对P2P流量传输进行稳定控制.  相似文献   

6.
为改善近邻传播聚类算法对高维数据的聚类效果,引入马氏距离替换原算法中的欧氏距离,并借助正则化总散度矩阵的奇异值分解实现数据变换预处理,进而在在降维后的变换子空间中对数据集进行聚类。针对Iris、User、Soybean和Vehicle四个数据集,选取适当正则化参数,经仿真实验可见,改进算法的聚类精度在整体上有所提高。  相似文献   

7.
本文首先介绍了P2P的定义及特征,并从对等的角度分析了它的特点,然后分析了当前各种P2P流量识别技术及研究进展,最后对P2P流量识别技术的发展提出了看法。  相似文献   

8.
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS)。该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类。同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果。实验结果表明该文提出的算法是有效可行的。  相似文献   

9.
针对流量分类中样本标注瓶颈和类不均衡问题,提出一种基于K均值和k近邻的半监督流量分类算法。采用K均值聚类算法将混有少量标记样本和大量未标记样本的数据聚成若干个簇,然后采用k近邻算法利用簇中标记样本对未标记样本进行分类。在分类过程中根据簇中标记样本分布调整参与分类的最近邻居数,从而克服了类不均衡对识别小类流的不利影响。理论分析和实验结果都表明,算法在面对非均衡协议流时提高了小类流的识别率。  相似文献   

10.
在MQAM信号的调制识别中,传统聚类算法聚类效果差,误差平方和函数出现起伏且收敛慢。对此问题,提出由标记的样本点来指导隶属度及聚类中心的更新的半监督聚类理论重构MQAM信号星座图的方法。通过分析星座图,提出了基于星座图圆半径的识别方法,完成了对不同阶数MQAM信号调制方式的识别。仿真结果表明该方法提高了聚类准确度,误差平方和函数曲线平滑,且MQAM信号的识别率在90%以上。  相似文献   

11.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

12.
该文以应用层流量分类为重点,分析了流量分类中的一些关键问题;为了适应现代网络管理,实现对应用层流量的实时监控,针对现有方法存在的问题,提出了一种分层次的应用层流量识别方法.为了具有对新应用的发现能力,结合基于深层包检测和基于数据流特征的方法,并同时使用基于无监督学习技术,发现P2P等新的网络应用.通过对校园网流量的跟踪...  相似文献   

13.
为了充分利用监督信息指导聚类过程,提出自适应半监督邻域聚类算法(adaptive semi-supervised neighborhood clustering algorithm,SSCAN).引入监督矩阵与距离度量结合,构造合理的相似矩阵;充分利用监督信息,通过标签信息矩阵与流形正则项结合调整模型,改善聚类效果.在...  相似文献   

14.
提出了一种基于信任抽样的P2P流量识别策略.在整个抽样识别的过程中,抽样比依据历史周期的P2P流量比例的估计量自动调整并动态变化.实验结果表明,基于对数变化的信任策略,能够在不增加抽样误差比率的同时有效降低系统的时间复杂度和资源消耗.  相似文献   

15.
基于跨层特征的P2P流量识别技术   总被引:1,自引:0,他引:1  
P2P技术飞速发展,应用形式不断多元化,很大程度上满足了人们信息共享和直接交流的需要;但是同时也对其他网络应用产生了很大的影响.因此,对高效可靠的P2P流量识别技术的研究刻不容缓.分析常见P2P流量识别技术的基础上提出一种基于跨层特征的P2P流量识别技术;试验结果表明该技术的可行性和可靠性.  相似文献   

16.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

17.
针对当前基于流特征的流量识别方法准确率较低的问题,提出一种基于互信息的P2P流量特征选择方法和基于该方法的随机森林技术在流量识别中的应用模型,将网络流数据流分为P2P流和非P2P流。实验证明,该方法具有较高的识别率,说明了采用随机森林技术进行P2P流量识别的有效性。  相似文献   

18.
为了解决传统的入侵检测聚类算法准确率较低这个问题,结合半监督学习的思想,提出了一种面向入侵检测的半监督聚类算法。首先利用样本数据集中的部分标记数据,生成用于初始化聚类的种子集,通过计算样本数据集中标记点与每个类簇中标记点均值的欧氏距离,得到每类的初始聚类中心,实现了入侵检测数据的准确识别。该算法有效地避免了传统聚类算法中初始聚类中心选择的盲目性和随机性,提高了检测率。实验结果表明,在处理入侵检测数据时,该算法能够充分利用少量类标记信息进行半监督学习,较传统的K-means算法聚类效果更好,检测准确率更高。  相似文献   

19.
为了能够快速准确地发现自然分布的、任意形状密度变化的聚类,提出了基于近邻传播的快速扫描算法,该算法利用最近邻居关系的传递特性实现数据集合的完全聚类,简化了传统聚类方法的最近邻居判定和计算,优化了搜索过程,实现了快速聚类分析过程。通过与同类算法的比对验证,结果表明该算法对目标数据集合的任意分布特性有很好的适应能力。  相似文献   

20.
协同过滤技术是推荐系统最具价值的核心技术之一,它能够深入地挖掘用户潜在的兴趣爱好并向用户做出比较合理的推荐;但是冷启动、数据稀疏性、可扩展性等问题依然制约该技术在实际推荐系统的应用。针对冷启动和数据稀疏性等问题,文章提出了一个基于近邻传播聚类的混合协同过滤推荐模型。该模型首先基于物品的标签属性进行聚类,挖掘出同类的物品并计算相似物品之间的关联程度,然后基于历史交互数据计算物品的相似度矩阵,最后按照一定权重混合构成一个物品相似度,并以此为用户进行推荐。与传统协同过滤推荐模型相比,该模型不仅提高了推荐精确度,而且改善了物品的召回率,能为用户提供更好的推荐体验。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号