首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 100 毫秒
1.
聚类分析中PAM算法的分析与实现   总被引:6,自引:2,他引:6  
首先详细讨论了PAM算法,包括:PAM算法的基本思想,如何替换中心点增进聚类质量,PAM算法的处理流程,代价函数的计算.相异度的计算.复杂度分析等.然后给出了一个实现PAM算法的实例。  相似文献   

2.
针对K-means算法处理海量数据的聚类效果和速率,提出一种基于MapReduce框架下的K-means算法分布式并行化编程模型。首先对K-means聚类算法初始化敏感的问题,给出一种新的相异度函数,根据数据间的相异程度来确定k值,并选取相异度较小的点作为初始聚类中心,再把K-means算法部署在MapReduce编程模型上,通过改进MapReduce编程模型来加快K-means算法处理海量数据的速度。实验表明,基于MapReduce框架下改进的K-means算法与传统的K-means算法相比,准确率及收敛时间方面均有所提高,并且并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性。  相似文献   

3.
陈新泉 《软件》2014,(5):62-68
为刻画某个复杂系统中相异对象对的某种关联关系,在给出若干定义之后,提出了一种相异对象对的关联度计算模型。为实现这种计算模型,给出了一种朴素计算算法。通过设计合适的数据结构,对这个朴素计算算法给出了一种以空间换时间的改进计算算法。通过人工数据集的仿真实验,可以验证关联度计算算法及其改进算法的等价性及算法在时间性能上的改进有效性。为推广这种计算模型并在实际中发掘它的应用价值,最后给出了一点研究展望。  相似文献   

4.
本文首次提出“相异因子r”的概念。并在“使解B*的相异程度最小”的思想指导下,改进了三Ⅰ算法单纯地求满足条件的最小模糊集的方法。并分别讨论了在Lukasiewicz蕴涵算予和Zadeh蕴涵算予之下的FMP规则以及相应的算法表达式。  相似文献   

5.
肖苏 《信息与电脑》2023,(4):113-115
为了提高线上线下教学资源整合效果,设计基于模糊聚类的线上线下教学资源整合系统。系统硬件部分进行了中央控制器和信息处理芯片设计。系统软件设计主要包括教学资源交换模块、数据库与资源整合计算。利用模糊聚类算法计算数据相异度,根据数据间相异度构建资源整合函数。系统测试结果表明,设计的系统整合线上线下教学资源后,信息冗余较低。  相似文献   

6.
K中心点算法——PAM的分析与实现   总被引:1,自引:0,他引:1  
赵书慧 《福建电脑》2008,24(6):104-105
详细讨论了PAM算法,包括PAM算法的基本思想,PAM算法的描述,代价函数的计算,相异度的计算等,然后给出了用C++实现PAM算法的程序段。  相似文献   

7.
为解决经典证据理论在证据冲突程度高的环境下合成容易导致Zadeh悖论的问题,提出一种解决冲突证据合成问题的算法。通过计算证据间的欧几里德距离构造相异度矩阵,计算证据的相异支持度、可信度和修正率,对证据进行修正后利用合成算法进行合成。实验结果表明,该算法可以很好地解决Zadeh悖论,合成结果优于现有一些典型方法。  相似文献   

8.
周涛  李华 《计算机应用》2010,30(4):1076-1078
为提高基于项目的协同推荐算法的预测效果,引入用户情景因素。首先计算用户情景因素的相异度矩阵,然后按照用户间相异度大小,采用基于等价相异度矩阵聚类算法对用户进行聚类。在聚类后的用户簇中,选取与目标项目相异度小的项目作为近邻,为用户对目标项目进行评分预测。最后,在标准的MovieLens数据集上进行实验。通过对改进的推荐算法与经典的基于项目的协同推荐算法Slope One进行比较,实验数据表明改进后算法的推荐结果有较大提高。  相似文献   

9.
文娟娟  柴玉梅 《计算机应用》2006,26(12):2982-2984
由于参数设置导致数据挖掘结果异常的例子很多,为了解决这一问题,出现了免参数据挖掘思想。对Kolmogorov复杂度理论进行了研究,将其和免参数据挖掘思想相结合,提出了一种基于压缩的相异度度量SCDM。由于压缩算法是空间和时间高效性算法,使得应用该算法的相异度度量也具有较好的性能。实验表明将这种相异度度量应用到层次聚类算法中,其聚类的准确率也较高。  相似文献   

10.
一种移动机器人全局路径规划新型算法   总被引:7,自引:0,他引:7  
王仲民  岳宏 《机器人》2003,25(2):152-155
针对模拟退火算法收敛速度慢这一缺陷,提出了一种基于共轭方向法和模拟退 火算法相结合的新型混合优化算法,并成功应用于机器人神经网络路径规划中.该算法可以 使优化解不陷入局部极值解而得到全局最优解.仿真实验研究表明:本文提出的这种新型混 合优化算法,计算简单,收敛速度快,显著提高了求解移动机器人全局最优化问题的计算效 率.  相似文献   

11.
提出度量多个集合之间总体差异程度的拓展集合差异度及相关定理,并给出一种新的解决分类属性高维数据聚类问题的CAESD算法。基于拓展集合差异度及拓展集合特征向量,在CABOSFV_C聚类的基础上通过两阶段聚类完成全部聚类过程。采用UCI数据集与K-modes及其改进算法、CABOSFV_C算法进行比较实验,结果表明CAESD算法具有较高的聚类正确率。  相似文献   

12.
13.
CABOSFV是一种有效的高维数据聚类算法。针对CABOSFV算法倾向于将数据对象分配到更大的类中这一问题,提出一种拓展差异度的高维数据聚类算法(CABOSFV_D)。该算法引入了调整指数[p],对原始稀疏差异度进行拓展,降低类大小对对象分配的影响;同时用位集的方式实现CABOSFV_D算法,使算法的运算效率明显提升。基于多个UCI标准数据集进行聚类实验,结果表明CABOSFV_D在聚类效果和时间效率上均优于原始CABOSFV算法。  相似文献   

14.
15.
One of the critical aspects of clustering algorithms is the correct identification of the dissimilarity measure used to drive the partitioning of the data set. The dissimilarity measure induces the cluster shape and therefore determines the success of clustering algorithms. As cluster shapes change from a data set to another, dissimilarity measures should be extracted from data. To this aim, we exploit some pairs of points with known dissimilarity value to teach a dissimilarity relation to a feed-forward neural network. Then, we use the neural dissimilarity measure to guide an unsupervised relational clustering algorithm. Experiments on synthetic data sets and on the Iris data set show that the relational clustering algorithm based on the neural dissimilarity outperforms some popular clustering algorithms (with possible partial supervision) based on spatial dissimilarity.  相似文献   

16.
Clustering aims to partition a data set into homogenous groups which gather similar objects. Object similarity, or more often object dissimilarity, is usually expressed in terms of some distance function. This approach, however, is not viable when dissimilarity is conceptual rather than metric. In this paper, we propose to extract the dissimilarity relation directly from the available data. To this aim, we train a feedforward neural network with some pairs of points with known dissimilarity. Then, we use the dissimilarity measure generated by the network to guide a new unsupervised fuzzy relational clustering algorithm. An artificial data set and a real data set are used to show how the clustering algorithm based on the neural dissimilarity outperforms some widely used (possibly partially supervised) clustering algorithms based on spatial dissimilarity.  相似文献   

17.
针对现有采煤机滚筒载荷识别方法相关算法实施难度大、工程实现方式复杂、应用难度高等问题,通过分析采煤机工作时音频信号的特征,提出一种基于音频识别的采煤机滚筒载荷识别方法。为确保每个分析周期内的音频信号具有同一运行标准下的负载工况,将截割电流与牵引速度作为变量引入到动态能量计算中,采用动态能量归一化算法(DENA)对采煤机原始音频信号进行归一化处理;将归一化后的信号与标准工况库中的信号进行对比分析,通过最大相异系数判断两者之间的差异性,从而确定滚筒载荷特征,实现滚筒载荷识别判断。试验结果表明:DENA可有效抑制音频信号中的噪声能量,提升音频信号中关键特征值的分辨率,采煤机在截割煤、岩时的音频信号特征参数界限明显,未出现交叉混叠现象;在理想情况下,即最大相异系数小于0.189时,总的煤岩界面识别率可达到78.6%。  相似文献   

18.
Conventional Fuzzy C-means (FCM) algorithm uses Euclidean distance to describe the dissimilarity between data and cluster prototypes. Since the Euclidean distance based dissimilarity measure only characterizes the mean information of a cluster, it is sensitive to noise and cluster divergence. In this paper, we propose a novel fuzzy clustering algorithm for image segmentation, in which the Mahalanobis distance is utilized to define the dissimilarity measure. We add a new regularization term to the objective function of the proposed algorithm, reflecting the covariance of the cluster. We experimentally demonstrate the effectiveness of the proposed algorithm on a generated 2D dataset and a subset of Berkeley benchmark images.  相似文献   

19.
为了对大规模训练样本进行缩减,提出了k近邻向量,给出了一种新的样本差异度的计量方法,证明了该差异度关于噪声识别和类边界距离的几个性质。依据此性质提出了一个高效的SVM训练样本缩减算法,算法首先根据样本差异度的性质剔除噪声样本,然后用类间差异度近似表示类边界距离,结合样本相似性,直接从原始样本空间剔除次要的训练样本。仿真结果表明,减样算法可以有效缩减样本,提高训练效率。  相似文献   

20.
为解决遗传算法应用于选播路由时存在的易于陷入局部最优问题,结合混沌扰动算子和相异度方法,提出了一种基于改进的遗传算法的选播路由算法。仿真实验结果表明,该算法具有较强的全局搜索能力,较好地解决了"早熟"收敛问题,能够快速、有效地从多个选播成员中找到满足带宽约束和时延限制,且代价最小的最优路径。通过分析仿真实验数据,证明了算法具有较快的收敛速度,且提高了找到最优解的成功率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号