首页 | 官方网站   微博 | 高级检索  
     

一种基于密度的并行聚类算法
引用本文:毛韶阳,李肯立.一种基于密度的并行聚类算法[J].计算机工程与应用,2007,43(30):157-161.
作者姓名:毛韶阳  李肯立
作者单位:1.湖南人文科技学院 数学系,湖南 娄底 417000 2.湖南大学 计算机与通信学院,长沙 410082
基金项目:国家自然科学基金 , 教育部科学技术研究项目
摘    要:针对微阵列基因表达数据聚类的高维复杂性,提出了一种基于密度的并行聚类算法,在APRAM模型的分布式存储系统中,通过欧几里德距离矩阵和密度函数两次时间复杂度为O(■)的计算,可使聚类过程的时间复杂度为O(■),以增加一次计算的代价来降低聚类过程的时间复杂度。基于8结点的机群计算实验表明:本算法能够达到较同类算法更高的并行加速比,提高高维生物数据的聚类速度。

关 键 词:并行运算  APRAM模型  划分聚类  密度函数  时间复杂度
文章编号:1002-8331(2007)30-0157-05
修稿时间:2007-06

Efficient parallel clustering algorithm based on density
MAO Shao-yang,LI Ken-li.Efficient parallel clustering algorithm based on density[J].Computer Engineering and Applications,2007,43(30):157-161.
Authors:MAO Shao-yang  LI Ken-li
Affiliation:1.Department of Mathematics,Hunan Institute of Humanities,Science and Technology,Loudi,Hunan 417000,China 2.School of Computer and Communication,Hunan University,Changsha 410082,China
Abstract:Aim at the high complexity of the gene expression data clustering,puts forward a parallel clustering algorithms based on the density.Uses MPI under the APRAM model,passing two compute with parallel time complexity is O() that of the Euclidean distance matrix and the density function,can make the parallel time complexity of clustering be O(),reduces the time complexity of clustering through adding one compute.The experiment based on eight nodes indicates that this algorithm can attain higher parallel accelerate ratio than the same kind algorithm,raise the clustering rate of the high dimension living data.
Keywords:parallel computing  APRAM model  partition-clustering  density function  time complexity
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号