首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
K-means算法对初始聚类中心及簇数K的选择敏感,导致聚类结果不稳定,会对IDS(intrusion detection system, IDS)的检测结果产生重要影响。针对该问题,提出一种基于细菌觅食优化算法(bacterial foraging optimization algorithm, BFOA)和K-means相复合的入侵检测算法(HIDS)。HIDS算法首先基于距离阈值方法动态确定簇数K,再利用BFOA优化生成初始聚类中心,使得选择的初始聚类中心达到全局最优,从而解决了K-means算法的聚类结果不稳定的问题,进而提高入侵检测的准确率。为验证算法的有效性和测试算法性能,将HIDS在KDD99数据集上进行试验测试,入侵检测率可达98.33%。试验结果表明该方法能够有效提高检测率并且降低误检率。  相似文献   

2.
针对基于核的多视图聚类算法(kernel based multi-view clustering method, MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means, IMVCKM)。通过将数据集分块,在每个数据块中使用MVKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。  相似文献   

3.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷, 提出基于进化思想的聚类算法及其类簇融合算法, 该算法将K均值聚类算法嵌入进化聚类算法框架中, 通过调整距离倍参, 将数据逐渐划分, 在此过程中自动确定类簇数目, 提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法, 将相似度大的类簇进行融合, 使得k值逐渐趋向真实值. 实验表明, 该方法具有良好的实用性.  相似文献   

4.
以往建立在模糊C均值(fuzzyC-means, FCM)框架下利用源域虚拟簇中心作为迁移知识的迁移聚类算法容易受到离群点和噪声的干扰,且单个簇中心不足以描述簇结构。针对此问题,提出多代表点自约束的模糊迁移聚类算法,该算法引入样本代表权重机制为簇中每个样本分配代表权重来刻画簇结构,这种机制能更好的刻画簇结构,对离群点和噪声有较好的抑制作用;同时利用源域样本,重构目标域簇结构,并以此作为迁移知识进行目标域样本聚类,相对于利用单中心作为迁移知识来说,整体重构后的目标域簇结构所包含的迁移知识量更为丰富。试验结果表明。在人工数据集和真实数据集上,所提出的聚类算法相比对比算法, NMI和ARI最高提升了0.674 5和0.608 4。说明在迁移环境下,以代表点自约束作为知识迁移规则,所提出的聚类算法具有一定的聚类效果。  相似文献   

5.
针对如何使用数据挖掘技术分析指导用户改善学习行为的问题,提出了一种基于兴趣度关联规则的学习行为分析方法.首先,采用K-means聚类方法快速归纳出用户的学习状态; 其次,通过含兴趣度的关联规则算法获得学习行为与学习效果之间的强规则; 最后,以edX平台提供的用户学习数据为例对算法进行了验证.结果表明:含兴趣度指标的算法所获得的强规则数目比传统关联规则算法缩减了40.9%,同时该方法能够得出学习行为因素与学习效果之间的具体关系,有利于指导用户改善学习行为.  相似文献   

6.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

7.
提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,提出了一种简化的粒子的编码规则,基于相异度矩阵进行粒子群优化K均值聚类,在保证聚类效果的基础上,有效降低了计算的复杂度.在多个UCI数据集上的实验结果表明,该算法是有效的。  相似文献   

8.
采用属性聚类的高维子空间聚类算法   总被引:4,自引:1,他引:3  
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.  相似文献   

9.
为了有效处理三维列联表数据,采用模糊联合聚类算法的思想,提出一种基于信息瓶颈理论的模糊三维聚类算法(IBFTC).IBFTC算法为每个维度指定隶属度函数,可实现3个维度上的同时聚类,且在目标函数中引入信息瓶颈理论计算对象与簇之间的距离.采用MovieLens数据集对IBFTC算法进行多方面分析,结果表明,IBFTC算法可获得比现有模糊联合聚类算法更高的聚类准确率.  相似文献   

10.
基于基因表达式编程的自动聚类方法   总被引:10,自引:1,他引:9  
为了解决聚类算法不能自动聚类的问题,提出并实现了自动聚类算法GEP-Cluster算法。主要工作包括:1)研究了基于GEP进化的最优簇划分;2)提出了自动合并簇算法Auto Merge Cluster Algorithm;3)实现了不需预知簇个数的聚类;4)在合成数据集上的实验表明,采用GEP-Cluster算法在未知簇划分信息的情况下可对数据集自动进行聚类分析,聚类成功率达到96%。  相似文献   

11.
在已知城市中压配电网的变电站位置、数量和容量的前提下,提出一种基于密度的改进K均值聚类算法,从初始聚类中心的选择和最佳聚类数K的确定两方面进行改进,并提出基于类间差异度和类内差异度的评价函数,对聚类结果的质量进行评估。将配电网划分为大小合适的配电网格,距离相近的变电站划分在同一网格内,每一网格独立供电,避免了距离过远的变电站之间的联络,为后续配电网络的优化规划提供了支撑。算例分析结果验证了该方法的有效性。  相似文献   

12.
传统粒子群算法的优点较为明显,但是随着环境复杂度的增高,传统算法的聚类中心敏感度升高,空聚类过多,类标号对聚类结果的影响不足等问题日趋严重.为此,提出了一种改进算法,以半监督K均值聚类为目标,以自适应K值的方式,随机地计算初始化聚类中心,并根据均值聚类算法的需要编码成粒子,同时引入软性约束概念重新构造目标函数;最后使用改进后的算法进行寻优.所提出的粒子群算法改进了自适应参数,引入了免疫扰动和混沌扰动2种扰动方式,同时应用了退火策略和动态聚类策略.实验结果表明,该算法在很大程度上解决了上述问题.  相似文献   

13.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

14.
针对单一聚类算法存在的不能泛化的问题,将集成学习技术应用于聚类算法中,集成学习技术可以显著提高学习系统的泛化能力。提出了1种基于粒子群和遗传算法的协同进化聚类集成算法,粒子群算法保证算法快速收敛,遗传算法全局搜索扩大搜索范围,提高了聚类的性能和收敛速度。将本研究提出的算法在多个UCI数据集上进行试验验证,结果表明该算法是有效的。  相似文献   

15.
针对典型模糊聚类算法难以准确获取最佳聚类数的问题,提出了一种基于改进划分系数的模糊聚类有效性函数.在划分系数方法基础上,将类与类之间的分离性和类内的紧致性相结合,引入指数函数有效抑制噪声和孤立点数据对聚类有效性的影响.仿真实验将所提及的聚类有效性函数应用于模糊C均值聚类中,分别对两组自定义数据集和IRIS数据集进行了有效性验证,实验结果表明,本文提出的模糊聚类有效性函数能够准确划分最佳聚类数.  相似文献   

16.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

17.
提出了一种基于蚁群聚类算法和裁剪方法的RBF神经网络优化算法。利用蚁群算法的并行寻优特征和一种自适应调整挥发系数的方法,提出一种新的聚类算法来确定RBF神经网络中基函数的位置;通过一种裁减的方法,除去对整个网络的输出贡献不是很重要的隐层单元来约简隐含层的神经元,以达到简化RBF神经网络结构的目的。对非线性函数进行逼近仿真,结果表明:优化算法有比较好的优化效果,而且,优化后的RBF神经网络的结构小,RBFNN的泛化能力得到了提高。  相似文献   

18.
To solve the problem of poor anti-noise performance of the traditional fuzzy C-means (FCM) algorithm in image segmentation, a novel two-dimensional FCM clustering algorithm for image segmentation was proposed. In this method, the image segmentation was converted into an optimization problem. The fitness function containing neighbor information was set up based on the gray information and the neighbor relations between the pixels described by the improved two-dimensional histogram. By making use of the global searching ability of the predator-prey particle swarm optimization, the optimal cluster center could be obtained by iterative optimization, and the image segmentation could be accomplished. The simulation results show that the segmentation accuracy ratio of the proposed method is above 99%. The proposed algorithm has strong anti-noise capability, high clustering accuracy and good segment effect, indicating that it is an effective algorithm for image segmentation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号