首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.

用代表点替代类均值代表类,用加权距离替代欧氏距离作为样本与类之间的相似性度量,由此建立一种新的无监督数据聚类算法.提取指标对分类所作贡献大小的量化值,以此为启发性知识定义加权距离,建立了用质心修正当前代表点的迭代算法.与均值聚类等序贯算法不同,基于质心的迭代算法的批处理性可消除输入产生的随机性干扰.采用IRIS数据和BreastCancer数据验证了该算法的有效性.

  相似文献   

2.
基于分类权与质心驱动的无监督学习算法   总被引:1,自引:0,他引:1  
为了充分挖掘隐藏在样本向量中的空间信息和知识信息: 用聚类点代替类均值, 把提取指标对聚类所做贡献的量化值定义为指标分类权; 用分类权定义样本点与聚类点的加权距离, 使之作为样本与类之间的相似性度量更具合理性, 即将加权距离转化为样本隶属度. 为了消除序贯算法产生的随机性, 用样本的K类隶属度作为点质量的样本质点组的质心, 修正当前的K类聚类点, 由此建立基于分类权和质心驱动的搜索聚类点的迭代算法. IRIS数据检验结果表明, 新算法的聚类效果与稳定性都优于已有的无监督学习方法.  相似文献   

3.
为避免初始聚类中心陷入局部最优,孤立点影响聚类准确性,结合分裂式思想,提出一种基于密度加权的K均值聚类算法.以K均值聚类算法为基础,引入分裂式思想,提取所有数据对象的属性值组建矢量,通过求解所有数据对象的全部属性,得到经过规范化预处理的数据对象矩阵,根据样本点与点群之间的最小最大距离,构建分裂式K均值聚类算法,采用样本点密度函数界定公式,选取出最优初始聚类中心,结合样本点间距离,完成密度加权下的分裂式K均值聚类算法设计.经对比实验结果发现,所提算法较好地解决了初始聚类中心选取的随机问题,在有效提高聚类准确性的同时大幅度降低了迭代次数,提升了聚类效率.  相似文献   

4.
定义了一个欧氏距离和监督信息相结合的最近邻计算函数,综合考虑无监督学习的空间距离和监督学习的标签数据的影响,从而将K均值算法很好地用于半监督聚类问题;针对K均值算法对初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,通过迭代搜索找到较优的聚类质心。同时提出动态管理种群的策略以提高粒子群算法搜索效率。新算法在UC I的多个数据集上测试都得到了较好的聚类准确率。  相似文献   

5.
基于半监督学习的K-均值聚类算法研究   总被引:4,自引:3,他引:1  
定义了一个欧氏距离和监督信息相混合的新的最近邻计算函数,从而将K-均值算法很好地应用于半监督聚类问题。针对K-均值算法初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,迭代搜索找到较优的聚类质心,同时提出动态管理种群的策略以提高粒子群算法搜索效率。算法在UCI的多个数据集上测试都得到了较好的聚类准确率。  相似文献   

6.
K-means算法由于其固有的初始聚类质心敏感性,存在聚类结果不稳定、容易收敛到局部最优等问题。现有改进方案在处理无噪数据集时能够在降低迭代次数的同时得到近似全局最优解,但在处理有噪数据集时容易陷入局部最优,甚至聚类效果低于传统的K-means算法。在最远空间距离确定初始质心算法的基础上,提出一种基于空间距离差的初始质心选择算法。该算法的核心思想是通过计算非聚类质心点到已选质心的距离和,并排序,选取相邻距离差最大的两点中靠近已知质心的点作为下一个簇的初始质心而实现的。实验结果表明,所提算法在聚类迭代次数相当的情况下,对不含噪声数据集的聚类准确度增加约1%,对于含有噪声的数据集,聚类准确度达到90%以上。  相似文献   

7.
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺陷,定义了簇间相似度度量对传统K-均值聚类进行改进.新算法可以在事先不确定K值的情况下,根据欧氏距离选取初始质心并按照K均值算法聚类,然后过滤噪声样本并确定簇半径,计算簇间相似度并合并相似簇确定数据集的类别数并得到较优的聚类结果.通过在UCI数据集的实验结果表明,新算法能准确确定类别数并有高于传统K均值算法聚类精度.  相似文献   

8.
传统K-均值聚类算法处理数据效率低下,而且结果偏差较大.为此,本文涉及一种优化算法,通过衡量处罚方式的程度控制算法迭代方式,以计算所得簇的平均误差的数值为依据,计算簇分配权值的大小,再用加权准则函数计算簇集中的加权距离,将取值最小的簇作为样本点,筛选掉平均误差较大的簇,从而提高算法的效率.用本文设计的算法与传统K-均值算法相比较,以含有大量噪音的数据集为实验数据,发现在抗噪性、聚类效果和运行稳定性方面,本文算法都明显优于传统算法.  相似文献   

9.
基于Web日志挖掘的Web文档聚类   总被引:3,自引:1,他引:2  
Web日志挖掘是Web挖掘的一种,介绍了Web日志挖掘的一般过程,研究了k-means聚类算法,并分析了k-means聚类算法的不足.k-means聚类算法迭代过程中每次都需要计算每个数据对象到簇质心的距离,使得聚类效率不高,针对这个问题,提出了k-means聚类算法的改进算法,该算法避免了重复计算数据对象到簇质心的距离,并用这两种算法实现了Web文档的聚类.试验结果表明,该改进算法提高了聚类效率.  相似文献   

10.
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。  相似文献   

11.
This paper discusses learning algorithms of layered neural networks from the standpoint of maximum likelihood estimation. At first we discuss learning algorithms for the most simple network with only one neuron. It is shown that Fisher information of the network, namely minus expected values of Hessian matrix, is given by a weighted covariance matrix of input vectors. A learning algorithm is presented on the basis of Fisher's scoring method which makes use of Fisher information instead of Hessian matrix in Newton's method. The algorithm can be interpreted as iterations of weighted least squares method. Then these results are extended to the layered network with one hidden layer. Fisher information for the layered network is given by a weighted covariance matrix of inputs of the network and outputs of hidden units. Since Newton's method for maximization problems has the difficulty when minus Hessian matrix is not positive definite, we propose a learning algorithm which makes use of Fisher information matrix, which is non-negative, instead of Hessian matrix. Moreover, to reduce the computation of full Fisher information matrix, we propose another algorithm which uses only block diagonal elements of Fisher information. The algorithm is reduced to an iterative weighted least squares algorithm in which each unit estimates its own weights by a weighted least squares method. It is experimentally shown that the proposed algorithms converge with fewer iterations than error back-propagation (BP) algorithm.  相似文献   

12.
DV-Hop定位算法是无线传感器网络中一种常用的基于非测距的定位技术,该算法使用平均跳距表示实际距离,在实际应用中造成很大的误差和节点能耗。为此,分析了加权DV-HOP 定位算法,并在加权算法基础上,引入多通信半径广播方法细化节点间的跳数,最后提出了一种基于加权DV-HOP的改进型RWDV-Hop定位算法。仿真结果证明,加权DV-HOP在定位精度上比DV-HOP算法提高了7.3%,改进型RWDV-HOP在定位精度上比加权DV-HOP算法提高了6.7%。  相似文献   

13.
王新芳  张冰  冯友兵 《计算机工程》2012,38(1):90-92,95
针对无线传感器网络低成本、高精度的要求,在采用接收信号强度测距的基础上,提出一种基于粒子群优化的改进加权质心定位算法。该算法易于实现,可调参数少,通过多次选代寻优提高定位精度。采用锚节点之间相互测距和定位补偿测距误差和定位误差。仿真结果表明,该算法与质心算法和加权质心定位算法相比,节点定位精度得到显著提高。  相似文献   

14.
基于RSSI的无线传感器网络修正加权质心定位算法   总被引:3,自引:0,他引:3  
提出了一种基于接收信号指示强度(RSSI)的修正加权质心定位算法,它区别于以往的加权质心定位算法,在该算法中采用测试距离倒数之和代替距离和的倒数作为权重,同时提出了修正系数的概念,避免了信息淹没现象,提高了定位精度。仿真结果表明,本文算法定位精度较之前的加权质心定位算法有了明显提高,最高可达17.83%。  相似文献   

15.
无线传感器节点加权平均跳距定位算法   总被引:1,自引:0,他引:1  
为了提高无线传感器网络节点定位精度,在DV-Hop算法基础上提出一种加权平均跳距定位算法IDV-Hop(Improved DV-Hop).根据 DV-Hop使用简单平均跳距计算节点间距离,导致较大误差这个特点,为了减少误差新算法采用加权平均跳距代替简单平均跳距.仿真实验结果表明,与DV-Hop算法相比,IDV-Hop算法有效地减少了距离计算带来的误差,提高了定位精度,能更好地满足实际应用的需求.  相似文献   

16.
针对模糊C均值(FCM)聚类算法具有初始聚类中心敏感和容易陷入局部最优的问题,提出了一种基于改进遗传算法(GA)的加权模糊c均值聚类算法,采用高斯变异算子,提高了遗传算法在每个峰值附近的局部搜索能力,用基于复相关系数的加权欧式距离代替欧式距离,改进了FCM算法的聚类目标函数.用改进的算法对国际标准测试数据Iris进行测试,实验结果表明改进后的算法具有更好的稳定性和健壮性,提高了聚类的效果.  相似文献   

17.
李高  何元烈  曾碧 《传感技术学报》2016,29(11):1692-1697
为了降低激光雷达测距系统的光斑信号噪声,提高系统的测距精度,对属性距离加权平均滤波及灰度质心法进行改进,提出一种应用于激光雷达系统的改进算法。以曲率为属性的属性距离加权平均滤波在去噪的同时很好地突出了光斑的峰值点。通过多次迭代计算灰度质心的求质心方法,进一步地提高光斑中心的定位精度,还解决了一般平方加权质心法容易受到噪声影响的问题。在MATLAB仿真环境中对实际采集的数据进行处理,实验表明本文算法对于4μs的像素单元可以取得0.05 pix的定位精度,并具有较好的稳定性。  相似文献   

18.
为了减小最短路径距离矩阵与欧氏距离矩阵之间的差异,提高MDS-MAP(C)算法的节点定位精度,提出一种改进的多维标度节点定位算法.该算法对MDS-MAP(C)算法进行了以下改进:采用启发式的搜索策略对最短路径距离矩阵进行修正,以减少最短路径距离矩阵与实际的欧氏距离矩阵之间的误差;利用smacof算法迭代误差函数代替SVD分解来求解节点的定位问题,以优化和改善节点定位的求解过程.实验结果表明,与MDS-MAP(C)算法相比,改进算法能够减少最短路径距离的误差,有效提高节点的定位精度,并且对不规则网络具有更好的适应性.  相似文献   

19.
该文在迭代阀值算法的基础上,引入Harris角点算法、质心算法,更快速、有效地从采集的标准图像中进行脸部特征点提取。并通过孤立点组合算法形成有效的特征参数。进一步使用欧氏距离衡量法与原有库的标准图像进行比对,找出最近相似人脸,实现对人脸的识别。  相似文献   

20.
陶骏  张碧霞 《数字社区&智能家居》2009,5(4):2586-2587,2593
该文在迭代阀值算法的基础上,引入Harris角点算法、质心算法,更快速、有效地从采集的标准图像中进行脸部特征点提取。并通过孤立点组合算法形成有效的特征参数。进一步使用欧氏距离衡量法与原有库的标准图像进行比对,找出最近相似人脸,实现对人脸的识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号