首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于突变基因网络的癌症驱动通路识别算法
引用本文:郭炳,郑文萍,韩素青.一种基于突变基因网络的癌症驱动通路识别算法[J].计算机科学,2018,45(7):230-236, 242.
作者姓名:郭炳  郑文萍  韩素青
作者单位:太原师范学院计算机科学与技术系 山西 晋中030619,山西大学计算机与信息技术学院 太原030006,太原师范学院计算机科学与技术系 山西 晋中030619
基金项目:本文受山西省回国留学人员科研基金(2017-014),国家自然科学基金(61572005),山西省软科学研究项目(2016041036-4)资助
摘    要:大型癌症基因组项目(TCGA,ICGC等)产生了大量的癌症组学数据,使人们深入研究癌症变为可能,其中寻找引发癌症的相关突变基因是一个重要挑战。在癌细胞中,基因变异可分为两类:一类是可导致癌症发生的驱动突变(driver mutation),另一类是对癌症发生扩散没有影响的乘客突变(passenger mutation)。识别癌症驱动基因有利于理解癌症发病原理和发展进程以及研发癌症药物或进行靶向治疗,是生物信息学中的重要问题。文中提出一种基于突变基因网络的癌症驱动通路识别算法GNDP,对癌症病人的体细胞突变数据进行分析。该算法定义了非重叠平衡度来度量基因对的位于同一驱动通路的可能性;根据基因对的非重叠平衡度、互斥和覆盖度,构建基因互斥网络,很大程度上减少了网络边数,提高了计算效率;在所构造的基因互斥网络中将查找到的极大团作为潜在驱动通路基因集合;用覆盖度和互斥度对潜在驱动通路基因集合进行筛选,得到其极大权重子团,并将其作为识别出的驱动通路。分别在模拟数据、肺腺癌以及多形性成胶质细胞瘤突变数据上对GNDP算法进行有效性验证,并将其与经典驱动通路识别算法Dendrix和Multi-Dendrix进行实验对比。结果表明,GNDP不需要指定驱动通路的基因个数,能在模拟数据上准确检测出所有人工设置的驱动通路;针对肺腺癌和多形性成胶质细胞瘤突变数据,GNDP在不需要任何先验知识的情况下达到较高的识别准确率,能高效地识别出主要驱动通路,其结果优于对比算法。

关 键 词:癌症基因组  体细胞突变  基因互斥网络  极大团  驱动通路
收稿时间:2018/1/28 0:00:00
修稿时间:2018/5/3 0:00:00

Driver Pathway Identification Algorithm Based on Mutated Gene Networks for Cancer
GUO Bing,ZHENG Wen-ping and HAN Su-qing.Driver Pathway Identification Algorithm Based on Mutated Gene Networks for Cancer[J].Computer Science,2018,45(7):230-236, 242.
Authors:GUO Bing  ZHENG Wen-ping and HAN Su-qing
Affiliation:Department of Computer Science and Technology,Taiyuan Normal University,Jinzhong,Shanxi 030619,China,School of Computer & Information Technology,Shanxi University,Taiyuan 030006,China and Department of Computer Science and Technology,Taiyuan Normal University,Jinzhong,Shanxi 030619,China
Abstract:
Keywords:Cancer genome  Somatic mutation  Gene networks  Maximal cliques  Driver pathways
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号