首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于范畴的数据降维方法   总被引:1,自引:0,他引:1  
范畴理论主要是一些特定数学的对象和映射的概括和抽象,在此利用范畴理论阐述图像分析和识别中的数据降维问题,定义高维数据降维范畴的过程,并以主成分分析范畴和等距映射范畴分别验证了范畴理论应用到图像数据降维问题中的正确性。  相似文献   

2.
在数据挖掘和机器学习等领域中,数据降维是解决高维数据分析与处理难题的有效手段。对t-SNE 降维算法进行了深入的研究,并对t-SNE 计算高维空间样本点相似度的过程进行了改进。t-SNE 算法直接利用样本点在高维空间中的欧氏距离来度量样本点的相似度,但欧氏距离在高维空间中不能忠实反映样本位于非线性流形上的相似关系。利用样本点在高维空间中的邻居结构,提出使用二阶邻近距离来度量样本点的相似度,并提出基于二阶邻近距离的随机近邻嵌入算法(Second Order t-SNE,ST-SNE)。在MNIST、USPS、COIL-20等多个数据集上进行了对比实验。实验结果表明,改进后的算法提升了降维结果的分类准确度和可视化效果。  相似文献   

3.
软件缺陷检测旨在自动检测程序模块中是否包含缺陷,从而加速软件测试过程,提高软件系统的质量。针对传统软件缺陷预测模型被限制在一定的应用范围而影响其预测的准确性和适用性,提出了一种基于PSO-BP软件缺陷预测模型。该模型运用粒子群优化算法优化BP神经网络的权值和阈值,采用交叉验证的方式进行实验,并与传统的机器学习方法J48和BP神经网络等方法进行了比较。实验结果表明提出的方法具有较高的预测准确性。  相似文献   

4.
针对t-SNE方法不能很好地区分相互交叉的多个流形的问题,提出一种可视化降维方法.在t-SNE方法的基础上,在计算高维概率时考虑欧几里得度量和局部主成分分析以区分不同流形.然后可直接使用t-SNE的梯度求解方法得到降维结果.最后分别用3个人工生成的三维数据集和2个通用的机器学习数据集进行实验,并根据不同流形的区分度和流形内的邻域可信度2个指标对降维结果进行量化分析.结果表明,该方法在处理有交叉的多流形数据时的效果要明显优于原来的t-SNE方法,并能够较好地保持每个流形的邻域结构.  相似文献   

5.
刘海  郝克刚 《计算机应用》2008,28(1):226-228
提出系统的方法来指导软件缺陷数据的定义。根据软件缺陷管理的一般目标和过程提出软件缺陷数据定义的准则和缺陷管理工具应具有的特性,并举例说明了缺陷数据定义的方法。完整地提出了软件缺陷数据定义的方法。正确的缺陷数据定义方法对于软件缺陷管理具有非常重要的意义。  相似文献   

6.
研究模糊逻辑和聚类分析在IT市场中的预测分析问题。模糊聚类分析是一种应用广泛的模糊数学方法,可广泛应用于各个领域。IT市场各类信息产品的价格行情是瞬息万变的。如何对市场做出及时、准确的判断和决策成为个IT公司重点关心的问题。本文首先阐述了模糊聚类分析的基本思想和一般的步骤,然后采用模糊聚类分析方法对笔记本市场进行有效的分类。结果表明模糊聚类分析法对IT市场预测分析准确、有效,且比其他方法预测的更接近实际的市场行情。  相似文献   

7.
张扬超  梅晓勇 《福建电脑》2007,(6):96-97,94
对于给定的多维事务数据对象的庞大数据集,有效选取显著特征因子是非常关键的,提取相关的主成分,替代原有的模式,能显著降低计算维数,使复杂问题简单化,达到良好的分类效果.结合一消费事务数据库,采用这种聚类降维技术,收到了较好的效果.  相似文献   

8.
为了设计高效的软件缺陷预测模型,提出一种将粒子群优化算法与朴素贝叶斯(NB)相结合的方法。该方法对历史数据进行离散化后,以NB分类的错误率作为粒子适应值函数,构建软件缺陷预测模型。通过对美国国家航天局软件工程项目的JM1数据进行仿真实验,证明该模型在预测性能方面优于同类方法,预测效果良好。  相似文献   

9.
“去繁存精”的光谱数据解耦方法可去除高维光谱数据的大量冗余,提炼其特征谱段,是光谱仪器得以广泛应用的重要基础。应用各异性和光谱特征优选方法普适性所构成的矛盾,在一定程度上制约了光谱仪 器的应用。本文提出了序列前向选择(Sequential forward selection,SFS) 的光谱特征自适应数据挖掘方法,生成最优变量组合作为支持向量机(Support vector machine,SVM)分类模型的输入,在对光谱数据降维的同时,实现了高精度的数据分类。本文方法可有效解决大量光谱数据的多类分类问题,并在红木分类中得到了实际验证和应用,为破 解因光谱特征峰高度混叠而难以进行主观经验特征选择的困境提供了新思路。  相似文献   

10.
为解决基因表达数据降维后未必能很好适应聚类任务的问题,提出面向聚类的谱扰动集成降维方法,将集成学习思想和基于聚类能力的加权方法用于降维模型中,在高维数据中抽取特征组合生成多个样本子集,对每个新样本子集降维,根据谱扰动理论基于聚类能力学习获得权重,加权组合得到最终降维结果。该方法对特征多次学习,充分利用高维特征,通过聚类能力更好地集成降维,使降维能够更好地适应聚类任务。通过实验验证了该方法的有效性。  相似文献   

11.
新的混合模糊C-均值聚类算法   总被引:1,自引:1,他引:1  
基于量子行为的粒子群算法(QPSO)是一种改进的粒子群优化算法.它使用的参数个数少,在解的收敛性和全局搜索能力上优于基本的粒子群算法(PSO).将QPSO算法与模糊C-均值(FCM)算法相结合提出一种新的混合模糊C-均值聚类算法(QPSO-FCM),新算法代替了FCM算法的基于梯度下降的迭代过程,在一定程度上克服了FCM算法易陷入局部极小的缺陷,降低了FCM算法的初值敏感度.实验结果表明,改进后的新算法与FCM算法和PSO与FCM结合算法相比,具有良好的收敛性,聚类效果也有较好的改善.  相似文献   

12.
为解决PSO-FCM聚类算法针对多聚类问题,性能不足,容易陷入局部最优解,影响多聚类结果的准确度.提出一种基于PCA优化的PSO-FCM聚类算法,通过引入PCA分析方法,在粒子的各维度上设定不同的移动权重,降低粒子的敏感度,合理的控制粒子各维度上移动的速度,有效的降低粒子各维度上粒子无约束,位于多个聚类群交界处的粒子过分敏感,移动到错误的聚类的可能性增加.本文简要介绍了PSO-FCM算法的相关情况,详细介绍了本文的优化算法,最后通过实验证明,本文提出的优化算法在多个数据集上结果总体优于其他算法.  相似文献   

13.
基于粒子群优化和模糊c均值聚类的入侵检测   总被引:1,自引:0,他引:1       下载免费PDF全文
针对模糊c均值算法对初始化敏感及易陷入局部极值的问题,利用粒子群优化算法的全局优化性能,结合模糊c均值聚类算法,提出基于粒子群优化和模糊c均值聚类的入侵检测方法。该方法可快速得到全局最优聚类,并且有效检测出未知的攻击。实验表明该方法不仅对未知攻击有较好的检测效果,而且具有较低的误报率和较高的检测率。  相似文献   

14.
通过分析在电子商务环境下Web挖掘的现状,考虑到Web数据的海量性和高维度性对抽取隐含的、事先未知的知识所带来的复杂性和维数灾,在普通K均值聚类、PSO聚类和K均值与PSO混合聚类算法的基础上,提出了一种将主成分分析与PSO混合聚类算法相结合的模型来对Web服务器中的日志文件进行聚类分析,将抽取的相关Web数据进行主成分分析,分析结果作为PSO混合聚类算法的输入数据,这样不仅减少了输入变量的维数,减少聚类的规模,而且保留了原始变量的主要信息,消除变量之间的多重共线性,为具有海量性、高维度性、异构性等特点的  相似文献   

15.
针对模糊c均值聚类算法自适应性不强、易陷入局部极小值及聚类效果不理想等问题,提出一种基于自适应混沌粒子群的聚类算法。对粒子群的加速因子进行动态设置,使粒子搜索机制具有自适应调节的功能;利用混沌扰动优化,使种群的多样性和全局搜索能力得到提高,利用边界缓冲墙对越界粒子进行处理,避免正负粒子飞越边界的干扰。选取 UCI机器学习库中的4种数据样本集进行测试,测试结果表明,该算法具有良好的性能。  相似文献   

16.
基于粒子群优化的模糊C-均值聚类改进算法   总被引:3,自引:3,他引:3  
针对模糊C-均值聚类算法(FCM)存在易陷入局部优化的问题,将粒子群优化算法(PSO)和模糊C-均值聚类算法FCM相结合,提出了一种新的模糊聚类算法PSO-FCM.该算法使用PSO算法来代替FCM的迭代过程以实现模糊聚类,具有了很强的全局搜索能力,从而不用再为得到好的聚类效果而反复选择初值.仿真实验结果表明,提出的模糊聚类算法提高了FCM的搜索能力,具有更好的稳定性和健壮性,优化能力增强,提高了聚类的效率和效果.  相似文献   

17.
粒子群聚类算法综述   总被引:3,自引:2,他引:3  
聚类分析是数据挖掘的重要技术之一,它能够通过无监督的学习过程发现隐藏的模式,具有独立发现知识的能力。对现有文献中基于粒子群优化算法的聚类分析技术作了全面的介绍,对几种主要的粒子群聚类算法的基本原理及其特点进行了总结,并分析比较了它们的优点和不足,概述了粒子群聚类算法的常见应用领域;最后探讨了粒子群聚类算法进一步的研究方向。  相似文献   

18.
基于混沌粒子群和模糊聚类的图像分割算法*   总被引:1,自引:2,他引:1  
模糊C-均值聚类算法(FCM)是一种结合模糊集合概念和无监督聚类的图像分割技术,适合灰度图像中存在着模糊和不确定的特点;但该算法受初始聚类中心和隶属度矩阵的影响,易陷入局部极小.利用混沌非线性动力学具有遍历性、随机性等特点,结合粒子群的寻优特性,提出了一种基于混沌粒子群模糊C-均值聚类(CPSO-FCM)的图像分割算法.实验证明,该方法不仅具有防止粒子因停顿而收敛到局部极值的能力,而且具有更快的收敛速度和更高的分割精度.  相似文献   

19.
在对基于异常的入侵检测进行训练时,缺少一个实时有效的训练集,提出了一种融合自控粒子群和免疫进化的入侵数据分类方法,对网络数据进行聚类分析,生成可靠的训练数据。粒子群模糊C均值聚类算法需要提前确定聚类数目,这在网络数据分析处理中是很难把握的,引入自控粒子群的方法根据迭代演算情况自动调节不同聚类数目的粒子群规模,使数据最后聚合在一个数目最优的聚类集中,同时为了克服陷入局部最优的问题,引入免疫进化机制,使部分粒子在当前最优指导下进行合理变异和替换,跳出局部最优解。  相似文献   

20.
基于粒子群优化算法的数据流聚类算法   总被引:1,自引:0,他引:1  
肖裕权  周肆清 《微机发展》2011,(10):43-46,50
针对当前基于滑动窗口的聚类算法中对原始数据信息的损失问题和提高聚类质量和准确性,在现有基于滑动窗口模型数据流聚类算法的基础上,提出了一种基于群体协作的粒子群优化算法(PSO)的新数据流聚类算法。这种优化的新数据流聚类算法利用改进的时间聚类特征指数直方图作为数据流的概要结构以及应用PSO在聚类过程中对聚类质量的局部迭代优化。实验结果表明,此方法有效减少了内存的开销,解决了对原始数据信息损失的问题。与传统的数据流聚类算法相比,基于粒子群优化算法的数据流聚类算法在聚类质量和准确性上明显优于传统的数据流聚类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号