排序方式: 共有49条查询结果,搜索用时 203 毫秒
21.
优化子空间的高维聚类算法 总被引:1,自引:0,他引:1
针对当前大多数典型软子空间聚类算法未能考虑簇类投影子空间的优化问题,提出一种新的软子空间聚类算法。该算法将最大化权重之间的差异性作为子空间优化的目标,并提出了一个量化公式。以此为基础设计了一个新的优化目标函数,在最小化簇内紧凑度的同时,优化每个簇所在的软子空间。通过数学推导得到了新的特征权重计算方法,并基于k-means算法框架定义了新聚类算法。实验结果表明,所提算法对子空间的优化降低了算法过早陷入局部最优的可能性,提高了算法的稳定性,并且具有良好的性能和聚类效果,适合用于高维数据聚类分析。 相似文献
22.
针对带有概念漂移的数据流的分类问题,提出一种新颖的能够识别并且适应概念漂移数据流的分类算法。该算法将原始数据流沿着时间轴划分为若干数据块后,选择第一块中有代表性的数据作为样本训练模型,从而减轻了噪声和边界对分类精度的影响,使得漂移检测能较为全面且对离群点不过于敏感;此后对随后的数据块进行分类,并依据分类结果动态修正当前分类模型。实验结果表明:该方法能够根据数据流的当前状况自动调整分类模型,快速适应数据流概念漂移的情况,并得到较好的分类效果。 相似文献
23.
运动想象脑电信号采集成本高且个体差异大,跨个体域构建脑电信号模式识别模型属于典型的小样本跨域学习任务。针对该任务,提出了一种运动想象脑电信号的跨域特征学习方法。该方法首先选择最优度量方法对齐协方差并提取共同空间模式特征;其次,在该特征基础上采用领域自适应方法学习目标域的最优跨域特征。为验证所提方法的可行性与有效性,采用经典模型识别跨域特征,在两个公开的数据集上进行对比实验。实验结果表明,通过所提方法学习到的跨域特征,在运动想象模式识别中,明显优于现有方法学习到的特征。此外,还详细对比了跨域特征学习方法的各项参数设置、性能及效率。 相似文献
24.
针对传统K-means型算法的"均匀效应"问题,提出一种基于概率模型的聚类算法。首先,提出一个描述非均匀数据簇的高斯混合分布模型,该模型允许数据集中同时包含密度和大小存在差异的簇;其次,推导了非均匀数据聚类的目标优化函数,并定义了优化该函数的期望最大化(EM)型聚类算法。分析结果表明,所提算法可以进行非均匀数据的软子空间聚类。最后,在合成数据集与实际数据集上进行的实验结果表明,所提算法有较高的聚类精度,与现有K-means型算法及基于欠抽样的算法相比,所提算法获得了5%~50%的精度提升。 相似文献
25.
基于层次划分的最佳聚类数确定方法 总被引:20,自引:0,他引:20
确定数据集的聚类数目是聚类分析中一项基础性的难题.常用的trail-and-error方法通常依赖于特定的聚类算法,且在大型数据集上计算效率欠佳.提出一种基于层次思想的计算方法,不需要对数据集进行反复聚类,它首先扫描数据集获得CF(clusteringfeature,聚类特征)统计值,然后自底向上地生成不同层次的数据集划分,增量地构建一条关于不同层次划分的聚类质量曲线;曲线极值点所对应的划分用于估计最佳的聚类数目.另外,还提出一种新的聚类有效性指标用于衡量不同划分的聚类质量.该指标着重于簇的几何结构且独立于具体的聚类算法,能够识别噪声和复杂形状的簇.在实际数据和合成数据上的实验结果表明,新方法的性能优于新近提出的其他指标,同时大幅度提高了计算效率. 相似文献
26.
增量KNN模型的修剪策略研究 总被引:1,自引:0,他引:1
KNN模型是k近-邻算法的一种改进版本,IKNNModel算法实现了基于KNNModel的增量学习.然而随着增量步数的增加,IKNNModel算法生成模型簇的数量也在不断地增加,从而导致模型过于复杂,也增大了预测的时间花销.提出一种新颖的模型簇修剪策略,在增量学习过程中通过有效合并和删除多余的模型簇,在保证精度的同时降低了模型簇的数量,从而缩短了算法的预测时间.在一些公共数据集上的实验结果验证了本方法的有效性. 相似文献
27.
自适应的软子空间聚类算法 总被引:6,自引:0,他引:6
软子空间聚类是高维数据分析的一种重要手段.现有算法通常需要用户事先设置一些全局的关键参数,且没有考虑子空间的优化.提出了一个新的软子空间聚类优化目标函数,在最小化子空间簇类的簇内紧凑度的同时,最大化每个簇类所在的投影子空间.通过推导得到一种新的局部特征加权方式,以此为基础提出一种自适应的k-means型软子空间聚类算法.该算法在聚类过程中根据数据集及其划分的信息,动态地计算最优的算法参数.在实际应用和合成数据集上的实验结果表明,该算法大幅度提高了聚类精度和聚类结果的稳定性. 相似文献
28.
一种基于KNN的融合聚类算法 总被引:1,自引:0,他引:1
聚类是数据挖掘领域一个被广泛研究的问题.单一的算法较难获得高的聚类准确率,甚至对于特定的数据集也很难找出最佳的方法进行聚类分析.提出了一种基于KNN的融合聚类算法(KNNCE),该算法基于累积k最近邻产生数据点间相似度,并通过single-link算法构建层次聚类树得到最终的聚类划分,且能够自动确定最佳聚类数,从而很好地解决以上的问题.最后,通过常用数据测试和入侵检测方面的应用表明该算法是有效的.还把它和同类算法进行比较和分析,以证明算法的优越性. 相似文献
29.
聚类是数据挖掘中的一项重要课题.在大型数据集中有效地发现具有任意形状、密度和尺度的簇结构是目前聚类算法研究中的一个开放性的问题.基于图形轮廓的思想,提出了一种快速的聚类算法PROFCLUS,使用数据点在图形空间分布形成的图形进行聚类,可以描述和发现任意类型的簇结构;聚类过程只扫描一遍数据集,通过渐进地构造图形映像的轮廓,使用少量的轮廓点信息进行增量的聚类,其时间复杂度接近于线性.实验验证表明,PROFCLUS可以对簇密度差异较大的数据进行有效聚类和噪声数据点识别;同时,与其他基于密度的算法相比,PROFCLUS大幅度提高了聚类效率. 相似文献
30.