首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
为进一步改善局部支持向量机的分类效率和分类精度,提出一种改进的局部支持向量机算法。该算法对每类训练样本分别进行聚类,使用聚类生成的样本中心点集代替样本,使用改进的k最近邻算法选取测试样本的k个近邻。分别在UCI数据集和自建树皮图像数据集上对本研究算法的有效性进行测试。实验结果表明,本研究提出的算法在分类精度和效率上具有一定的优势。  相似文献   

2.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

3.
针对传统神经网络经常无法满足短期负荷预测的实际应用要求,本文提出了基于Bagging算法和Elman神经网络结合的电力系统短期负荷预测模型。把经预处理过后的数据分为原始训练集和测试集,然后通过Bootstrap方式在原始训练集中随机抽取若干个子训练集,并建立相应的Elman神经网络负荷预测模型,并将子训练集分别用于训练不同的网络模型,最后利用测试集进行预测,最终的预测结果取不同模型预测结果的平均值。利用训练不同模型的Bagging算法,消除Elman神经网络的不稳定性,提高了预测模型的精度和稳定性。通过某城市负荷预测的实际算例,对所提出的预测模型与单一的Elman神经网络预测模型进行对比分析。分析结果表明,基于Bagging算法和Elman神经网络融合的预测模型具有较好的预测精度和稳定性。该研究具有一定的应用前景。  相似文献   

4.
多标记学习中通常存在大量未标记示例,本研究结合协同训练(Co-training)方法充分利用数据集中的未标记示例,在数据集上选取局部k NN(k nearest neighbor)和全局k NN进行训练得到两个分类器,分类器分别标记未标记示例并相互更新训练集。协同训练过程不断迭代进行,直至训练完成。试验结果表明,该方法性能均优于其他多标记学习算法。  相似文献   

5.
由于LDA模型需要预先给定话题个数k,因此在进行最优话题个数k选取时需要对语料库进行k值循环计算,从而加剧了算法的复杂度。针对LDA模型的最优k值选取问题,提出LDA话题增量训练算法。该方法首先以词-话题概率熵值作为LDA迭代过程中模糊单词的选取标准,并将抽取模糊单词归入新话题;其次,增加LDA变分推理过程中全局参数β(单词-话题概率矩阵)和α(狄利克雷分布参数)的维数及话题个数k;再次,将变换后的全局参数β、α和k作为输入进行变分训练;最后,循环调用LDA话题增量训练算法并在似然函数值收敛时停止循环过程,完成k的增量训练。此外,通过对真实数据集的实验分析验证了本文算法对最优k值选取的有效性和可行性。  相似文献   

6.
主要阐述了决策树学习算法在交通方式选择模型中的应用.在基本决策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型,以Bagging预测方法和CART算法为主,以随机特征选择和"投票"方法为辅,并相互融合,结合具体实例详细介绍该模型的建立,从数据的选择到整个森林中树的数目和每个结点处抽取的候选属性的个数调整,并对模型进行了相应的评估.实验结果表明,随机森林预测精度高,且对噪声数据具有较强的稳健性,采用决策树学习算法得出的规则在交通方式选择的分析中具有较好的实用价值.  相似文献   

7.
提出一种改进的多核支持向量机算法。利用特征向量的信息熵,计算出特征向量关于分类标签的信息增益,用该信息增益作为数据集特征向量的权重系数,然后结合多核支持向量机的核学习能力,对特征向量非均等区别对待,使得分类更加准确。对比实验结果表明,与支持向量机、多核支持向量机相比,改进算法分类正确率得以提升。  相似文献   

8.
基于小波变换的人脸检测   总被引:3,自引:1,他引:2  
提出了一种基于二维离散小波变换的人脸检测算法。该算法采用Haar小波计算小波脸,导出了提取人脸特征向量的相应公式,利用感知准则训练线性分类器进行分类判决。在4个不同的人脸数据集上与特征脸方法进行了比较。结果表明,该算法的计算效率和检测精度均优于特征脸方法。  相似文献   

9.
肿瘤基因选择方法LLE Score   总被引:1,自引:0,他引:1  
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性.  相似文献   

10.
广义回归神经网络的改进及在交通预测中的应用   总被引:1,自引:0,他引:1  
本研究基于k近邻的方法通过网络性能评价指标来对平滑因子进行选择确定。通过k近邻法找出使得网络性能评价最好的平滑因子,不再仅依赖于一个均方误差数值,而根据均方误差组的排序来选择最优的平滑因子。该算法能够在保持较好的预测效果的前提下解决因数据波动性大而最终得不到最优平滑因子的难题。通过预测交通数据的实验验证了算法的有效性。结果表明通过k近邻方法得到的最优平滑因子会使网络预测误差降至最小。  相似文献   

11.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

12.
针对基于核的多视图聚类算法(kernel based multi-view clustering method, MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means, IMVCKM)。通过将数据集分块,在每个数据块中使用MVKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。  相似文献   

13.
利用图划分技术和图论算法实现给水管网分区。根据给水管网分析,确定分区数量,建立权重邻接矩阵并计算图拉普拉斯矩阵及其特征向量,通过多路图划分对隐藏在特征向量中的聚类信息进行数据挖掘,采用遗传算法和K均值方法实现最佳节点聚类。利用PageRank和最短路径算法确定水表和阀门位置,最终实现给水管网优化分区。实际给水管网模型分区实例表明所提方法在给水管网分区的有效性。  相似文献   

14.
基于轮廓曲率和谱系聚类的大鼠体态自动识别   总被引:1,自引:0,他引:1  
为了对行为实验中大鼠的体态进行自动识别分析,提出了一种基于轮廓曲率和谱系聚类的识别算法.应用图像处理技术从序列实验图像中分别提取出大鼠轮廓曲线,计算大鼠轮廓曲线的曲率函数及其频谱,并以频谱作为体态聚类和识别的特征矢量.应用谱系聚类方法构建每种大鼠体态特征矢量的子类聚类中心特征矢量.应用1319幅样本图像和10629幅测试图像对本算法进行了实验.结果表明对样本图像和测试图像的识别正确率分别为94.16%和89.58%,该算法可用于大鼠体态的自动识别及后续的行为分析.  相似文献   

15.
聚类分析的一个重要应用就是图像识别,谱聚类因为比传统的聚类方法更高效而迅速被广泛运用到图像处理中。谱聚类算法其中一个重要的步骤是构造一个合适的相似矩阵,本文提出一种基于共享近邻重要性的自适应谱聚类算法且应用到数字手写图像识别中,与自适应谱聚类算法做比较试验,表明谱聚类算法能取得较好的识别结果。  相似文献   

16.
基于加权样本的FCM快速算法研究   总被引:2,自引:0,他引:2  
为改进FCM算法在处理大样本集聚类时速度慢、耗时多的缺点,根据样本在特征空间中的特征值分布情况,引入等价样本和样本加权概念,在此基础上提出了FCM(Fuzzy C-Means)的快速算法一般形式:WFCM(Weighted Fuzzy C-Means)算法.理论上证明了WFCM算法和FCM算法对样本集分割的等价性,并且,WFCM在运算性能方面明显优于FCM算法.而两个算法在灰度图像分割上的例子验证了WFCM算法的快速性和有效性.  相似文献   

17.
K-means算法对初始聚类中心及簇数K的选择敏感,导致聚类结果不稳定,会对IDS(intrusion detection system, IDS)的检测结果产生重要影响。针对该问题,提出一种基于细菌觅食优化算法(bacterial foraging optimization algorithm, BFOA)和K-means相复合的入侵检测算法(HIDS)。HIDS算法首先基于距离阈值方法动态确定簇数K,再利用BFOA优化生成初始聚类中心,使得选择的初始聚类中心达到全局最优,从而解决了K-means算法的聚类结果不稳定的问题,进而提高入侵检测的准确率。为验证算法的有效性和测试算法性能,将HIDS在KDD99数据集上进行试验测试,入侵检测率可达98.33%。试验结果表明该方法能够有效提高检测率并且降低误检率。  相似文献   

18.
对基于分形维数的聚类融合算法进行了研究。首先介绍分形维数聚类算法,产生聚类成员;然后利用投票法进行聚类融合;最后简单介绍了云计算环境下分布式聚类融合思想。基于分形维数的聚类融合算法比单一分形维数聚类算法得到的聚类结果更好,具有更好的鲁棒性。在分形维数聚类算法中,结合网格聚类与单一分形聚类的优点,提出了基于网格和分形维数的聚类算法,它可以发现任意形状且距离非邻近的聚类,适合于海量﹑高维数据。  相似文献   

19.
为解决核模糊相似性度量谱聚类算法的样本点降噪问题,优化聚类效果和稳定性,本文从分析异常点分布特性出发,引入局部异常因子(LOF)算法,提出聚类中心候选对象的概念,过滤数据集的噪声数据,从而优化初始聚类中心的计算,突出正常样本点在聚类中心调整中的影响力,使聚类算法更易于得出准确的聚类结果. 同时提出一种局部过滤因子以修正相似性度量的方法,该方法通过放大正常数据之间的权值、缩小正常数据与噪声数据间的权值,使优化后的核模糊谱聚类算法大大降低对异常点的敏感度. 算法有效性实验和算法稳定性实验表明:该方法对相似性度量修正的有效性使核模糊谱聚类算法更为稳定和鲁棒.  相似文献   

20.
提出了一种基于协同谱聚类的推荐系统托攻击防御算法. 该算法首先使用谱聚类方法对协同聚类算法进行改进,以在用户和项目2个维度上同时进行聚类;接着在聚类基础上结合分级偏离平均度对用户进行项目推荐. 实验测试结果表明,在同等托攻击规模的情况下,该算法可以降低实施托攻击的用户和攻击数据对系统推荐结果的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号