首页 | 本学科首页   官方微博 | 高级检索  
     

基因表达数据中局部模式的查询
引用本文:姜涛,李战怀,尚学群,陈伯林,李卫榜. 基因表达数据中局部模式的查询[J]. 计算机科学, 2016, 43(7): 191-196, 223
作者姓名:姜涛  李战怀  尚学群  陈伯林  李卫榜
作者单位:西北工业大学计算机学院 西安710072,西北工业大学计算机学院 西安710072,西北工业大学计算机学院 西安710072,西北工业大学计算机学院 西安710072,西北工业大学计算机学院 西安710072
基金项目:本文受国家“九七三”重点基础研究发展规划(2012CB316203),国家“八六三”高技术研究发展计划(2015AA015307),国家自然科学基金重点项目(61033007,61332014),国家自然科学基金面上项目(61272121,61572367),中央高校基础研究经费项目(3102015JSJ0011)资助
摘    要:基因表达数据分析一般是通过挖掘局部模式来实现的。保序子矩阵是局部模式挖掘中一种经典的模型,可以获取到在若干条件下表现出一致趋势的一组基因。高通量基因微阵列技术的进步,促进了海量基因表达数据的产生,使得对高性能基因表达数据分析算法的需求极为迫切。现有方法大多数是通过批量挖掘的方法来分析数据,即使有通过查询方式来获取精确结果的方法,其全面性与性能也有待提高。为了提高数据分析的效率与准确性,首先提出一种基于前缀树的基因表达数据索引gIndex,然后给出了一种基于列关键词查询的保序子矩阵分析方法GEQc。其不经过批量挖掘,只需要建立索引并通过关键词来完成正相关/负相关/时滞等模式的查询。实验结果表明,与现有方法相比,所提算法具有良好的数据分析效率与可扩展性。

关 键 词:基因表达数据  局部模式  保序子矩阵  关键词查询
收稿时间:2016-04-18
修稿时间:2016-06-07

Local Pattern Query from Gene Expression Data
JIANG Tao,LI Zhan-huai,SHANG Xue-qun,CHEN Bo-lin and LI Wei-bang. Local Pattern Query from Gene Expression Data[J]. Computer Science, 2016, 43(7): 191-196, 223
Authors:JIANG Tao  LI Zhan-huai  SHANG Xue-qun  CHEN Bo-lin  LI Wei-bang
Abstract:Local pattern mining plays an important role in gene expression data analysis.One classical model in local pattern mining is order-preserving subMatrix (OPSM),which captures the general tendency of subset of genes in subset of conditions.With the development of high-throughput gene microarray techniques,it produces massive of gene expression datasets.In this situation,it is urgent to design high performance algorithms.Most of the existing methods are batch mining technique,even though it can be addressed by query method,the comprehensiveness and behaviors still should be improved.To make data analysis efficient and accurate,we first proposed a prefix-tree based indexing method for gene expression data,then gave a column keyword based OPSM query methods.It uses index and search method instead of batch mining to query positive,negative and time-delayed OPSMs.We conducted extensive experiments and compared our method with existing methods.The experimental results demonstrate that the proposed method is efficient and scalable.
Keywords:Gene expression data  Local pattern  Order-preserving submatrix  Keyword-based query
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号