共查询到10条相似文献,搜索用时 156 毫秒
1.
作为模式识别最基本的分类方法之一,聚类在各个科学领域的数据分析中都扮演着重要的角色.然而随着大数据的出现,聚类分析在前沿发展中不断地面临着计算复杂度和计算成本等新的问题和挑战.通过研究k-means聚类算法的时间复杂度O(nk),针对迭代过程中大量的最近邻计算和其特殊场景,引入KD树作为索引,提出了基于单KD树的近似近邻算法和基于多KD树的交叉搜索算法.将k-means聚类算法的时间复杂度降为O(nlog k),并通过实验验证,基于多树的交叉搜索算法具有与k-means聚类算法相当的聚类质量. 相似文献
2.
提出了一种基于密度的聚类并行算法,在APRAM模型的分布式存储系统中,通过欧几里德距离矩阵和密度函数两次时间复杂度为O(n2)的计算,可使聚类过程的时间复杂度变为O(n),以增加一次计算的代价来降低聚类过程的时间复杂度。基于8结点的机群计算实验表明本算法能够达到较同类算法更高的并行加速比,能提高高维生物数据的聚类速度。 相似文献
3.
4.
针对基于特征匹配的目标识别算法复杂度高、难以实时处理的问题,提出基于快速鲁棒性特征(SURF)的快速特征匹配算法.通过应用双阈值顺序聚类算法对特征点进行聚类,并对每一个聚类建立k-d搜索树,采用优先搜索算法匹配模板与图像的特征点,提高了算法实时性.采用RANSAC鲁棒估计算法消除错误匹配点对,计算模板与图像平面之间的单应矩阵,进而实现对目标的准确识别定位.仿真实验证明了算法的有效性和实用性. 相似文献
5.
在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部核矩阵都被使用,从而降低经典算法的时间空间复杂度。理论分析和实验结果表明,改进算法保持与经典算法相近聚类精度,提高了聚类效率,验证了改进算法的有效性。 相似文献
6.
针对基于特征匹配的目标识别算法复杂度高、难以实时处理的问题,提出基于快速鲁棒性特征(SURF)的快速特征匹配算法。通过应用双阈值顺序聚类算法对特征点进行聚类,并对每一个聚类建立k-d搜索树,采用优先搜索算法匹配模板与图像的特征点,提高了算法实时性。采用RANSAC鲁棒估计算法消除错误匹配点对,计算模板与图像平面之间的单应矩阵,进而实现对目标的准确识别定位。仿真实验证明了算法的有效性和实用性。 相似文献
7.
核k-means算法是标准k-means算法的扩展,提高了k-means聚类中对非线性不可分数据的聚类效果.传统核k-means算法的初始中心是随机选取的,导致出现聚类时间较慢、聚类性能低等问题.文中提出了一种基于D2权重的核k-means算法,它根据点对簇内距离的贡献,选取对其贡献最大的点为簇中心,然后在核空间内进行相应的聚类.在UCI数据集上进行实验,实验结果表明,新算法相对于传统的核k-means算法,可以有效地缩短聚类时间,并提高聚类的质量,新算法性能优于传统的核K-means算法. 相似文献
8.
9.
聚类是最常用的数据挖掘算法之一.为了提高聚类结果的质量,应用拉格朗日乘数法提出了一种基于属性权重最优化的k-means聚类算法.该算法在计算样本与质心的距离时为各属性赋予相应的权重以表示属性的重要程度,并在每轮迭代中根据质心向量的变化自动计算最优的属性权重,使得所有样本与相应质心的距离和最小.实验结果验证了该方法相对于传统k-means算法的优势. 相似文献