首页 | 本学科首页   官方微博 | 高级检索  
     

基于Hadoop的化合物生物活性分析系统
引用本文:李杰辉,张亮,陈健,南蓬.基于Hadoop的化合物生物活性分析系统[J].计算机工程,2012,38(13):48-50.
作者姓名:李杰辉  张亮  陈健  南蓬
作者单位:1. 复旦大学计算机科学技术学院,上海,200433
2. 复旦大学生命科学学院,上海,200433
基金项目:国家“863”计划基金资助项目
摘    要:通过药物虚拟筛选,发现在具有生物活性化合物过程中,存在小分子结构相似性比较计算繁杂等问题。为此,结合MapReduce模型,提出一种基于Hadoop的并行计算模型处理方法,并通过Hadoop工具予以实现。同时根据Hadoop分区算法不均匀、容错功能存在重复计算等问题对该方法进行改进。实验结果表明,该方法平均加速效率达到0.91,具有较好的可靠性和扩展性。

关 键 词:生物活性  生物信息学  并行计算  可扩展性  数据库  Hadoop框架
收稿时间:2011-12-19

Compounds Biological Active Analysis System Based on Hadoop
LI Jie-hui , ZHANG Liang , CHEN Jian , NAN Peng.Compounds Biological Active Analysis System Based on Hadoop[J].Computer Engineering,2012,38(13):48-50.
Authors:LI Jie-hui  ZHANG Liang  CHEN Jian  NAN Peng
Affiliation:b(a.School of Computer Science;b.School of Life Sciences,Fudan University,Shanghai 200433,China)
Abstract:The prediction of biological active compounds,which requires heavy computation in practice,is more and more important in drug discovery and chemical genomics.This paper proposes a Hadoop-based parallelized method for searching and predicting drug-like compounds combining MapReduce model,and the method is realized through Hadoop tool.According to the problems of the inhomogeneity of Hadoop partition algorithm,and computation of fault-tolerant function,the method is improved.Experimental results show that the method provides an effective,scalable and simple way to solve the heavy computation problem,and its average accelerated efficiency achieves 0.91.
Keywords:biological activity  bioinformatics  parallel computing  scalability  database  Hadoop frame
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号