共查询到16条相似文献,搜索用时 78 毫秒
1.
应玉龙 《计算机技术与发展》2012,(7)
为降低传统 FCM 算法的计算复杂性,提高 Web 用户聚类的效果,文中提出了一种改进的基于特征属性的 Web 用户模糊聚类算法.首先通过用户访问页面的次数和时间建立 Web 用户兴趣度矩阵,并根据商品的特征属性值将 Web 用户兴趣度矩阵映射为用户对特征属性的偏好矩阵,从而有效降低数据稀疏性;然后以此为数据集,对传统的 FCM 算法进行了改进,将聚类中心分为活动和稳定两种,忽略稳定聚类中的距离计算以降低计算复杂性.最后通过仿真实验证实了新算法的有效性和可行性. 相似文献
2.
针对数据集中若存在孤立点或者是噪声数据会影响模糊C均值聚类算法(FCM)的聚类性能问题,本文将离群点的辨认方法与FCM算法相结合,提出一种改进的FCM聚类算法。该算法有效地降低了孤立点或噪声数据对正常数据的影响,提高了FCM算法的聚类精度。将该算法在入侵检测系统中进行实验验证,通过与FCM算法进行对比分析,证明了该算法的有效性和可行性。 相似文献
3.
4.
一种基于蚁群算法的模糊C均值聚类 总被引:22,自引:0,他引:22
针对模糊C均值(FCM)聚类算法,在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解,FCM算法自身并不能确定聚类个数需要人为设定,并在数据分类应用时具有了一定误差的问题,提出了一种基于蚁群算法的FCM聚类算法。该算法根据蚁群聚类算法确定模糊聚类个数和FCM算法的初始聚类中心:利用蚁群算法的全局搜索性、并行计算性等特点避免了聚类陷入局部最优解:仿真结果表明了该算法的有效性。 相似文献
5.
模糊C均值聚类容易受噪声数据影响,进而影响聚类准确率.鉴于此,提出了一种改进萤火虫算法的模糊聚类方法.该方法首先在萤火虫算法中引入Chebyshev映射初始化种群的分布;然后提出一种自适应步长方法来平衡探索与开发能力;最后在局部搜索过程中对每次迭代的最优个体加入高斯扰动策略,使其跳出局部最优.该过程拥有良好的寻优能力,... 相似文献
6.
在大量的模糊聚类算法中,模糊C均值聚类算法是应用最为广泛的,然而它存在着一些缺点:对初始值敏感,对噪声数据敏感,容易陷入局部最优。针对以上问题,提出了一种基于粒子群优化的模糊聚类算法,利用粒子群强大的全局寻优能力,这种算法克服了模糊C均值聚类算法的缺点,试验证明,这种算法是一种很有潜力的模糊聚类算法。 相似文献
7.
针对模糊C-均值聚类对初始值敏感、容易陷入局部最优的缺陷,提出了一种基于萤火虫算法的模糊聚类方法。该方法结合萤火虫算法良好的全局寻优能力和模糊C-均值算法的较强的局部搜索特性,用萤火虫算法优化搜索FCM的聚类中心,利用FCM进行聚类,有效地克服了模糊C-均值聚类的不足,同时增强了萤火虫算法的局部搜索能力。实验结果表明,该算法具有很好的全局寻优能力和较快的收敛速度,能有效地收敛于全局最优解,具有较好的聚类效果。 相似文献
8.
《计算机应用与软件》2013,(8)
针对传统模糊C均值聚类算法只能发现"类球状"簇和对分量属性数据敏感的缺点,提出一种基于FCM的属性分解聚类再融合的分类算法。该算法将信息融合的思想应用于聚类算法,先在每个分量属性维度进行聚类,然后对各属性的聚类结果进行融合分析并得到聚类结果。独立对每个分量属性聚类的思想为算法的并行实现提供便利。实验结果表明,该算法不但能有效提高聚类的准确度,而且不需要提前对数据进行归一化处理,在分量属性量测数据存在偏差时仍然表现出良好的鲁棒性。 相似文献
9.
《计算机应用与软件》2014,(2)
Web用户聚类是通过分析用户会话,将具有相同或相似访问特征的用户聚为一类。在会话相似性度量方面综合考虑了网页浏览时间和访问频次两个因素,并考虑到用户个人习惯、能力等因素对浏览时间的影响,将浏览时间处理为RDP(Reduce the Differences in Personality)浏览时间,以降低其个性特征。为此,提出一种基于用户特性的RDPk-means聚类算法。实验表明,该算法可以有效实现用户会话的聚类,聚类结果客观合理。 相似文献
10.
结合Web用户访问特点,针对Web用户访问路径聚类分析中普遍存在的对象类别不确定性现象进行了研究.结合模糊聚类和可能性聚类的特点,提出来一种新的用户访问路径的可能性模糊聚类算法.新方法通过定义相关的截集,自动地将对象分配到若干簇中,避免了人工干预,实现了交叉聚类的目的.新方法建立在leader聚类算法的框架上,只需要扫描数据集一遍使得算法效率大大提高.在标准数据集上的对比试验表明新算法不仅是有效的,而且效率较高. 相似文献
11.
Web日志挖掘是Web数据挖掘领域中的一个重要研究方向,是通过对Web日志记录的挖掘发现用户访问Web页面的浏览模式用以改进Web站点的性能和组织结构。在介绍Web日志挖掘的原理和技术的基础上对Web日志挖掘中的聚类技术进行了分析研究,并重点讨论了有关模糊聚类算法的原理及计算过程,对这一算法进行了改进后的优化和应用,最后用实例对算法加以验证。 相似文献
12.
13.
文中提出一种新的方法通过使用模糊c均值对原始数据集进行预处理操作,通过这个操作可以把定量属性值转换为二进制值,继而就会得到原始数据集的模糊版本(由模糊记录和模糊属性组成)。另外,文中又提出了一种基于模糊Apfiori算法的快速提取规则的算法,这种算法是利用模糊聚类从先前得到的原始数据集的模糊版本中提取模糊频繁项集从而可以得到模糊关联规则。在文章的最后,实验结果显示了提出的新算法在处理大型数据集时在挖掘时间上要优于传统的Apriori算法。对大型数据库来说,该算法在实用性和可用性上面都有很好的发展前景。 相似文献
14.
关于模糊C-均值(FCM)聚类算法的改进 总被引:3,自引:0,他引:3
针对模糊C-均值(FCM)聚类算法的容易收敛于局部极值的不足,提出了一种改进的模糊FCM聚类算法,此新算法在聚类中心选取和优化过程中进行了充分的考虑,是一种用于确定最佳聚类数的聚类算法,并且利用了分阶段思想,结合动态直接聚类算法和标准聚类算法,来尽量避免模糊C-均值(FCM)聚类算法的不足。新算法与传统(FCM)聚类算法方法相比,提高了算法的寻优能力,并且迭代次数更少,在准确度上也有较大的提高,具有很好的实际应用价值。 相似文献
15.
王杨 《计算机与数字工程》2014,42(9):1610-1612
利用粒子群优化(PSO)算法全局寻优的特点,很大程度上避免了模糊C-均值聚类(FCM)算法对初值敏感、易陷入局部收敛的缺陷.利用收敛速度快的K均值聚类法得到的聚类中心作为PSO算法初始聚类中心的参考,提出一种新的模糊C-均值聚类算法Improved PSO FCM.实验结果表明,论文算法提高了FCM的搜索能力,聚类更为准确,效率更高. 相似文献
16.
网络攻击连接具有行为的多变性和复杂性等特征,利用基于传统聚类的行为挖掘技术来构建异常入侵检测模型是不可行的。针对网络攻击行为的特点,提出了基于特征选择的模糊聚类异常入侵模型。首先通过层次聚类算法改善了FCM 聚类算法结果对初始聚类中心的敏感性,再利用遗传算法的全局搜索能力克服了其在迭代时易陷入局部最优的缺点,并将它们结合构成一种AGFCM 算法;然后采用信息增益算法对网络攻击连接数据集的特征属性进行排序,同时利用约登指数来删减数据集的特征属性以确定特征属性容量;最后利用低维特征属性集和改进的FCM 聚类算法构建了异常入侵检测模型。实验结果表明该模型对绝大多数的网络攻击类型具有很好的检测能力,为解决异常入侵检测模型的误警率和检测率等问题提供了一种可行的解决途径。 相似文献