首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
基于孙子定理构造均匀的Hash函数并继承Karp-Rabin模式匹配思想,利用“筛选”方法,给出一种机群系统上的多目标串匹配并行算法。通过预处理将字符串映射成惟一的一对整数值,采用比较一对整数值来取代逐个字符比较字符串的方法使得匹配过程快速且比较结果是确定的:“筛选”节省了比较时间。算法分析和实验结果表明该并行算法简明、高效和可扩展。  相似文献   

2.
针对K-medoids算法中初始聚类中心的结点的选取的随机性导致影响聚类结果质量的问题,采用标签共现原则对该算法进行改进.根据标签共现频率和相似度先对标签进行聚类,根据标签聚类结果,选取K个由其代表的资源作为聚类初始中心结点.通过聚类中心的优化设置,降低了抽样选取的随机性.最后采用MapReduce框架对其进行并行化,以豆瓣图书的标签数据为应用背景进行实验,验证了算法的实用性.  相似文献   

3.
针对模糊聚类算法对初始聚类中心敏感、容易陷入局部最优的问题,采用并行小生境粒子群优化算法对模糊聚类算法进行改进.通过山谷函数对小生境进行识别以形成互斥的多个子群,采用惩罚函数实现多子群并行搜索过程中的信息共享机制,引入混合聚类有效性函数获取最佳聚类数.仿真结果表明,该算法能提高模糊聚类算法的搜索效率以及分类精度.  相似文献   

4.
为了进一步提高计算效率,提出一种面向计算机集群的并行聚类算法.首先合理划分数据块,之后由集群中的节点并行聚类,最后合并聚类结果.这期间采用动态负载平衡和异构的通讯方式.实验证明该并行算法不仅能得到正确的聚类结果,并能够大幅度提高聚类速度.  相似文献   

5.
文章结合SPEA2和NSGA-Ⅱ两个多目标进化算法,基于岛屿模型,提出了一种新的并行多目标进化算法。该算法采用多线程实现,适合在多核处理器或机群系统上执行。实验结果通过与串行算法SPEA2和NSGA-Ⅱ比较证明了该并行算法的有效性。  相似文献   

6.
分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一。针对目前并行分层聚类算法处理大数据集时速度较慢的特点,提出一种并行数据预处理算法,该算法可使原始输入数据的规模最多减少为原来的1/10,从而可减少总的并行分层聚类时间。在测试数据集上的实验结果表明使用本算法进行预处理后,能显著减少分层聚类的运行时间。  相似文献   

7.
遥感图像PCA融合的并行算法研究与实现   总被引:2,自引:0,他引:2  
文章针对已有的遥感图像PCA融合串行算法,提出了一种基于数据并行的新的PCA融合并行算法PPCA.并对该并行算法进行了通信优化,在机群系统上进行了实现。针对IKONOS图像进行实验的结果表明该算法可获得良好的并行加速比.并行效率较高,为遥感图像的实际应用提供了有益的指导和借鉴。  相似文献   

8.
提出一种焊点优化算法,同时为了创建更快的方法来完成优化过程的模拟,基于MPI库采用静态分配任务和任务池两种并行方案,对焊点优化算法进行并行化实现.在机群系统下测试表明,并行方法可以显著减少程序运行时间,提高优化模拟过程的效率.  相似文献   

9.
针对空间脉冲位置调制系统中采用最大似然检测算法时存在计算复杂度高的问题,依据空间脉冲位置调制信号矩阵的特点,提出了一种基于K均值聚类的分步分类检测算法.首先,采用基于信号向量检测算法完成训练样本中光源索引号的检测,利用K均值聚类算法对训练样本进行离线训练得到其质心与调制符号间的映射关系.然后,以该映射关系为准则完成在线...  相似文献   

10.
为了解决传统k-means算法需要输入k值和在超大规模数据集进行聚类的问题,这里在前人研究基础上,首先在计算距离时引入信息熵,在超大规模数据集采用数据抽样,抽取最优样本数个样本进行聚类,在抽样数据聚类的基础上进行有效性指标的验证,并且获得算法所需要的k值,然后利用引入信息熵的距离公式再在超大数据集上进行聚类。实验表明,该算法解决了传统k-means算法输入k值的缺陷,通过数据抽样在不影响数据聚类质量的前题下自动获取超大数据集聚类的k值。  相似文献   

11.
Generating high-quality gene clusters and identifying the underlying biological mechanism of the gene clusters are the important goals of clustering gene expression analysis. To get high-quality cluster results, most of the current approaches rely on choosing the best cluster algorithm, in which the design biases and assumptions meet the underlying distribution of the dataset. There are two issues for this approach: 1) usually, the underlying data distribution of the gene expression datasets is unknown and 2) there are so many clustering algorithms available and it is very challenging to choose the proper one. To provide a textual summary of the gene clusters, the most explored approach is the extractive approach that essentially builds upon techniques borrowed from the information retrieval, in which the objective is to provide terms to be used for query expansion, and not to act as a stand-alone summary for the entire document sets. Another drawback is that the clustering quality and cluster interpretation are treated as two isolated research problems and are studied separately. In this paper, we design and develop a unified system Gene Expression Miner to address these challenging issues in a principled and general manner by integrating cluster ensemble, text clustering, and multidocument summarization and provide an environment for comprehensive gene expression data analysis. We present a novel cluster ensemble approach to generate high-quality gene cluster. In our text summarization module, given a gene cluster, our expectation-maximization based algorithm can automatically identify subtopics and extract most probable terms for each topic. Then, the extracted top k topical terms from each subtopic are combined to form the biological explanation of each gene cluster. Experimental results demonstrate that our system can obtain high-quality clusters and provide informative key terms for the gene clusters.  相似文献   

12.
针对MFSK通信信号的分类问题进行了改进和分析。首先选取接收机输出的MFSK信号的时频脊线作为分类特征,然后针对无监督聚类算法中FCM算法对初始值敏感,易收敛至局部最优解的缺陷,提出了一种基于核的模糊C均值聚类算法来求取最佳聚类数M,提高了聚类精度。计算机仿真结果证实了所提方法的有效性和正确性。  相似文献   

13.
时间序列的相似性度量是衡量两个序列相似性的依据.动态时间弯曲距离计算方法具有较强的健壮性且可以度量不同长度的时间序列间的相似性,但其十分耗时.采用波前式推进方法并行计算动态时间弯曲距离并以流水线并行方式传送局部子结果,提出一个在机群系统上实现的度量两个时间序列相似性的并行算法.PC机群系统上的实验结果表明,该并行算法高效,获得了良好的加速和可扩展性.  相似文献   

14.
无线传感器网络资源有限,通常采用分簇聚合减少传输数据,本文提出了一种基于聚合收益的动态成簇算法.首先,针对网络整体能耗最优化问题,建立一个非线性整数规划模型,进而提出一种近似最优、低复杂度的启发式簇头选举算法.在此基础上,提出一种分布式的、基于聚合收益的动态成簇算法,可分布式实现该簇头选举算法并进行成簇.理论分析和实验仿真表明,基于聚合收益的动态成簇算法能较好地解决节点负载均衡问题,提高网络能耗效率,延长网络生命周期.  相似文献   

15.
基于克隆算法的网络结构聚类新算法   总被引:15,自引:2,他引:15       下载免费PDF全文
李洁  高新波  焦李成 《电子学报》2004,32(7):1195-1199
基于目标函数的聚类算法是目前应用最为广泛的聚类分析方法之一.然而这类算法都需要类别数和聚类原型的先验知识,且只能分析具有相同原型的数值型数据.此外这类算法还存在对初始化敏感,易陷入局部极值点等弱点.为此,本文提出一种基于克隆算法的网络结构聚类新算法以实现聚类分析的自动化.由于新算法将克隆选择与禁忌克隆相结合,使网络既具有免疫的特异性又具有免疫的耐受性,通过分析网络神经元的最小生成树,能够快速准确地获得类别数以及相关的分类信息.对各种类型的数据集的测试结果均表明,本文提出的新算法对于处理具有混和特征的数据集聚类分析问题是相当便捷有效的.  相似文献   

16.
本文提出了一种实现合成孔径雷达(SAR)成像处理的并行距离/多普勒算法,该算法能有效地提高SAR的成像处理速度,是实现SAR实时成像处理的有效途径,该算法尤其适合于超级并行机(MPP)及工作站和微机构成的群机系统进行并行计算。实验结果表明该并行算法能有效地减少SAR成像处理的运算时间。最后给出了原始数据的成像结果。  相似文献   

17.
In this study, an optimal method of clustering homogeneous wireless sensor networks using a multi‐objective two‐nested genetic algorithm is presented. The top level algorithm is a multi‐objective genetic algorithm (GA) whose goal is to obtain clustering schemes in which the network lifetime is optimized for different delay values. The low level GA is used in each cluster in order to get the most efficient topology for data transmission from sensor nodes to the cluster head. The presented clustering method is not restrictive, whereas existing intelligent clustering methods impose certain conditions such as performing two‐tiered clustering. A random deployed model is used to demonstrate the efficiency of the proposed algorithm. In addition, a comparison is made between the presented algorithm other GA‐based clustering methods and the Low Energy Adaptive Clustering Hierarchy protocol. The results obtained indicate that using the proposed method, the network's lifetime would be extended much more than it would be when using the other methods. Copyright © 2011 John Wiley & Sons, Ltd.  相似文献   

18.
模糊核聚类算法是一种结合无监督聚类和模糊集合概念的图像分割技术,已广泛应用于图像分割领域,但其算法对初值敏感,很大程度上依赖初始聚类中心的选择,并且容易收敛于局部极小值,用于图像分割时,隶属度的计算只考虑了图像中当前的像素探值,而未考虑邻域像素探间的相互关系,故对分割含有噪声图像不理想。故提出了一种改进的模糊核聚类图像分割算法,先通过数据约简,不损失数据聚类结构的前提下对数据进行挖掘,然后在模糊核聚类算法中引入特性核函数,将约简后的数据映射到高维非线性特征空间进行划分,最后再利用表征邻域像素的参数来修正当前空间像素的隶属度。实验结果表明,提出的算法较好地解决了模糊核聚类算法在局部极值处收敛和在迭代过程中出现停滞等问题,最终得到最佳全局聚类,迭代次数降低明显,并具有高鲁棒性、对噪声不敏感的特点。  相似文献   

19.
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号