串联重复序列比对的位置筛选方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

串联重复序列比对的位置筛选方法

作者姓名：	温华铭徐云杨金宝

作者单位：	中国科学技术大学计算机科学与技术学院;安徽省高性能计算重点实验室,中国科学技术大学计算机科学与技术学院,华中农业大学信息学院

基金项目：	国家自然科学基金面上项目(61672480);国家外专局111引智计划资助项目(BP0719016)

摘要：	串联重复序列是基因组构建的困难片段,由于其重复单元之间的相似性与其拷贝数的不确定性,在序列比对时容易定位到多个候选位置,如何快速而准确地筛选出正确的比对位置是一项挑战。现有方法使用种子（从测序片段中选取的短序列）来定位并扩展候选比对位置,但挑选种子时未考虑串联重复序列特性。因此,提出了一种串联重复序列比对的位置筛选方法,其通过计算稀有kmer（长度为k的子序列）序列的相似性来筛选比对结果。此外,采用合并稀有kmer的策略加速计算,并利用基于编辑距离的模糊查找以提高过滤信息密度。实验结果表明,在模拟数据集上提高比对结果的召回率与准确率的同时,该方法比现有方法快约2倍,且具有良好的并行加速性能。
关键词：	串联重复单分子实时测序序列比对种子-扩展法
收稿时间：	2023-12-25
修稿时间：	2024-06-04

	点击此处可从《计算机应用研究》浏览原始摘要信息
	点击此处可从《计算机应用研究》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏