首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
乙型肝炎病毒(Hepatitis B Virus,HBV)感染作为严重影响人类健康的疾病之一,是导致慢性肝脏疾病、肝硬化和肝癌的主要元凶。HBV由于其自身复制的特殊性,具有高变异特性,据研究表明HBV基因变异是HBV持续感染的根本原因。为了了解HBV的基因变异情况,检测HBV序列的SNP位点即单突变位点已广泛应用于大量的研究,所检测出的SNP位点对指导临床有重要意义。但是目前关于SNP位点检测的方法多因技术难度较高,费用大等不利因素而受到制约。因此,探讨一种基于计算机的SNP位点检测方法成为一种趋势。针对HBV序列的 SNP位点的特点,提出了一种基于最优风险与预防模型的HBV序列的SNP位点检测方法。方法首次应用于HBV序列的SNP位点检测,实验结果表明:该方法不仅有效地检测出HBV序列的X基因片段和前C区基因片段中已经报道的位点,而且还发现了一些新的SNP位点。与硬件检测SNP位点不同的是,所提出的计算机方法具有操作简单和费用低的优点,而且普通实验室和医疗机构均可以承受。  相似文献   

2.
针对品种鉴别中面临的SNP(Single Nucleotide Polymorphisms)数据高维小样本的难点,研究利用少数高信息量SNP位点正确鉴别品种的方法,提出了一种新的SNP位点筛选方法。先利用PCA提取SNP主要位点,随后使用随机森林方法,根据平均精度下降和Gini指数下降对主位点的重要性进行评估,训练分类模型。最后分别选取重要度排名前48和96的位点,以这些位点为分类特征,建立分类模型进行品种鉴别。将该模型应用于6种绵羊Illumina OvineSNP50的SNP数据。实验表明,可以从46 013个位点中分别筛选出49、96个高信息量位点用于品种鉴别,鉴别准确率达到97%以上。该方法减少了用于品种鉴别的SNP位点个数,降低了品种鉴别成本。  相似文献   

3.
SNP(单核苷酸多态性)是发生在DNA序列上单个核苷酸碱基之间的变异,是生物可遗传变异中最常见的一种变异。ED算法和SNP-index算法是计算SNP位点的2种常用算法。由高通量测序获得拟南芥F2代全基因组测序数据,基于Linux平台对测序数据进行过滤、筛选和比对,通过算法实现结果,比较不同算法检测得到的SNP位点数量和SNP基因型比例。实验结果表明,通过ED算法得到的SNP位点数量更多,分布更广,相对分布密度大于SNP-index算法的,但是2种算法得到的SNP位点数量和SNP基因型比例相近。  相似文献   

4.
SNP数据在人类遗传病诊断与治疗中存在重要作用,但SNP原始数据存在大量冗余,因此需要选择出信息量大的SNP,完成SNP数据的降维.针对常用聚类算法应用到信息SNP选择时未考虑单个SNP与SNP子集之间相似度的问题,采用一种新的相似度度量方法,提出了一种改进的聚类算法K-MIGS,并将其应用到SNP选择中.K-MIGS算法解决了传统K-means不能挖掘出SNP位点与SNP子集之间的强相关性问题,并在医院提供的临床数据实验中表明,K-MIGS具有更高的非信息SNP子集重构度.最后使用支持向量机、决策树和神经网络对构造的SNP子集进行分类实验,对比K-means、特征加权K-means、ReliefF和MCMR,结果表明K-MIGS分类准确率和F1指标上提升了10%和15%,充分说明K-MIGS在信息SNP选择中具有更好的效果.  相似文献   

5.
个体单体型问题参数化算法研究   总被引:1,自引:0,他引:1  
个体单体型问题指如何利用个体DNA测序片断数据,根据不同的优化准则确定该个体单体型的计算问题.因为技术上的限制,DNA测序实验中能直接测定的片断长度是有限的,一个片断所覆盖的最大SNP位点数k1通常小于10;出于时间和金钱的考虑,覆盖一个SNP位点的最大片断数k2也不是很大,通常约为10左右;与要测定的单体型SNP位点总数,n及所测序的DNA片断总数m相比,k1和k2均很小.在此基础上,文中对个体单体型问题最少SNP位点删除MSR和最少片段删除MFR模型进行了参数化,提出了时间复杂度分别为O(nk1k2+mlogm+mk1)和O(mk22+mlogm+nk2)求解无空隙MSR和MFR的精确算法.和Bafna等提出的时间复杂度为O(mn2)和O(m2n+m2)的精确算法相比,文中的算法效率提高了很多,具有较高的实用价值.  相似文献   

6.
分子生物学研究方法的快速发展给综合性遗传研究实验室的实验和数据管理工作提出了严峻的挑战.针对基因分型实验室的特点和需求,对基于SNP实验流程的信息管理系统进行了扩展和升级,在原有LIMS系统所包括的3个SNP分型实验管理模块的基础上,扩展到包括多类基因分型实验的8个实验管理模块,并增加了数据处理、报表展示等模块,完善了数据查询、导出功能,为遗传基因分型实验数据管理与分析提供更全面的支持.本文简要介绍系统的框架结构、设计实现和主要功能.  相似文献   

7.
随着高通量的单核苷酸多态性(Single Nucleotide Polymorphism, SNP)检测技术的发展,世界各地的实验研究积累了大量的SNP数据,但是目前尚无一个全面综合的SNP数据库.SNP在致病基因发现、司法鉴定、个体化医疗等方面的应用得到了极大的关注和发展,因此有必要建立一个整合的人类SNP数据库.在整合中需要进行大规模的单核苷酸多态性位点的验证,该工作通过一个自主开发的、健壮的、用户友好的生物信息学集群计算工具包EasyCluster在集群系统上得以高效完成.  相似文献   

8.
随着基因组计划的完成,人们需要尽快从这些海量数据中了解基因组的结构,揭示生命的奥秘,剪接位点识别是其中的一个重要环节,然而到目前为止该问题仍未能得到很好的解决。在分析此问题时引入了第三代遗传标记单核苷酸多态性(SNP),以期探索变异对剪接机制的影响;其次,对DNA序列的数字化进行了探讨。通过实验表明,单核苷酸多态性的引入对于剪接位点识别算法的性能有着一定的影响,此外文中提出的编码方法对预测精度的提升亦有正面作用,整体效果比目前常用方法有了大幅提升。  相似文献   

9.
赵婧  魏彬 《计算机工程与科学》2016,38(11):2328-2334
研究复杂疾病与SNP之间的相关性是生物信息学最为重要的任务之一,然而基因分型的巨大花费却限制了其发展及应用。因此,选择部分有代表性的SNP(即标签SNP选择问题)进行研究,从而降低研究所需费用就显得十分必要。近年来,已有一些算法被提出用于解决该问题,但是大多数方法在预测精度及标签选择数目等指标方面仍未能达到实际应用的需求。据此,设计了一种前向矩阵法用于标签SNP的选择,并用改进的PSO算法对非标签SNP进行预测。最后通过大量数据集上的实验表明了算法与常用方法相比可选择更少的标签,同时可获得更高的预测精度,即在性能方面有了明显的提升,更适合于标签SNP选择问题的研究。  相似文献   

10.
人类基因组中存在"头对头"方式的基因对,两个基因5’端相邻并分别位于DNA的正负两条链上,其转录起始位点之间的距离不大于1 000bp。一般认为"头对头"基因对可能共享同一个启动子,即"双向启动子"。通过鉴定出1 190对"头对头"基因对,表达相似性结果显示比随机情况更倾向于共表达。"头对头"基因对的遗传调控位点研究显示,SNPs对"头对头"基因对存在不同的调控模式,有助于进一步理解双向启动子的调控机制,为进一步了解人类基因转录调控机制提供帮助。  相似文献   

11.
近年来,单体型检测问题已经得到了广泛的研究,成为计算生物学最热门的领域之一.本文对个体单体型重建问题进行研究,提出一种基于带权最少字符修改模型重建单体型的启发式算法HAW.HAW算法首先生成一对初始单体型,然后通过对初始单体型的不断扩充完成重建.实验结果表明HAW算法能有效求解模型,得到较以往算法更高的重建率,且算法运行速度较快,具有很高的实用价值.  相似文献   

12.
张强锋  徐云  陈国良  车皓阳 《软件学报》2007,18(9):2090-2099
研究了在门德尔遗传定理和哈代-维恩伯格平衡假设下,三元家庭基因型数据的单体分型和单体型频率估计问题.过去的研究仅仅关注个体间没有联系或者含有一般家系信息的基因型数据,而对这种特殊的三元家庭关注得不够.考虑到HAPMAP数据库中有一部分数据就基于这种三元家庭,现在有越来越多的需求要求直接分析这种特殊的家系结构.提出一个两段式的三元家庭中单体型频率的估计方法:i) 分型阶段,找出每一个三元家庭零重组单体构型;ii) 频率估计阶段,在前一阶段得到的单体构型基础上,应用EM算法来估计单体型频率.在程序包TRIOHAP中用C语言实现了单体分型算法和EM算法,并且使用模拟和实际数据测试了TRIOHAP的有效性和效率.实验结果表明,TRIOHAP要比其他那些忽略了三元家庭信息的常见单体型频率估计软件运行快很多.进一步地,由于TRIOHAP利用了这些信息,其估计结果更加可靠.  相似文献   

13.
Abstract: We used several machine learning techniques to predict the susceptibility to chronic hepatitis from single nucleotide polymorphism (SNP) data. These are integrated with several feature selection algorithms to identify a set of SNPs relevant to the disease. In addition, we apply a backtracking technique to a couple of feature selection algorithms, forward selection and backward elimination, and show that it is beneficial to find the better solutions by experiment. The experimental results show that the decision rule is able to distinguish chronic hepatitis from normal with a maximum accuracy of 73.20%, whereas the accuracy of the support vector machine is 67.53% and that of the decision tree is 72.68%. It is also shown that the decision tree and decision rule are potential tools to predict susceptibility to chronic hepatitis from SNP data.  相似文献   

14.
SNP功能分析的生物信息学方法及其资源   总被引:3,自引:0,他引:3  
在后基因组时代,单核苷酸多态性 (Single Nucleotide Polymorphism,SNP) 数据的快速积累使得用计算方法对编码区和非编码区SNP进行功能分析成为可能;但是目前各种SNP功能预测方法的预测精度均不能令人满意.针对这一问题,文章根据SNP的分类,分别对错义SNP、同义SNP和非编码区SNP功能分析的生物信息学方法进行了总结.其中重点介绍了基于序列特征和基于结构特征的有害错义SNP预测方法.还介绍了互联网上提供SNP资源和功能注释工具.分析表明,各种SNP功能分析方法还有很大的改进余地.  相似文献   

15.
闫萍  张祥德  焦明海 《计算机工程》2005,31(22):228-230
阐述了Oracle8作业队列的工作原理,并介绍了Oracle8数据库调度作业的方法。针对由于移动通信网络管理系统中数据量大且数据来源复杂而造成的数据库作业调度难于管理和Oracle中SNP进程资源有限的问题,分析了网管系统中采集数据的特点,提出了在一个SNP进程中运行多个存储过程的设计方案,使数据库中的作业调度更加系统、有序,有效地提高了系统的运行效率。  相似文献   

16.
论述了温度、湿度、振动,通风的温度、流量等综合环境应力集中控制的原理,提出了串口通信和网络通信相结合的方案实现对综合环境试验系统的集中控制.应用先进的DataSocket技术实现了主控计算机对振动控制系统的远程监控;基于SNP协议,应用动态链接库完成了主控计算机和PLC的通信,应用RS232串口通信上实现了主控计算机与通风子系统的通信.  相似文献   

17.
In this paper, we propose new missing imputation methods for the missing genotype data of single nucleotide polymorphism (SNP). The common objective of imputation methods is to minimize the loss of information caused by experimental missing elements. In general, imputation of missing genotype data has used a major allele method, but this approach is not far from the objective of the imputation - minimizing the loss of information. This method generally produces high error rates of missing value estimation, since the characteristics of the genotype data are not considered over the structure of given genotype data. In our methods, we use the linkage disequilibrium and haplotype information for the missing SNP genotype. As a result, we provide the results of the comparative evaluation of our methods and major allele imputation method according to the various randomized missing rates.  相似文献   

18.
19.
基于Relief和SVM-RFE的组合式SNP特征选择   总被引:1,自引:0,他引:1  
针对SNP的全基因组关联分析面临SNP数据的高维小样本特性和遗传疾病病理的复杂性两大难点,将特征选择引入SNP全基因组关联分析中,提出基于Relief和SVM-RFE的组合式SNP特征选择方法。该方法包括两个阶段:Filter阶段,使用Relief算法剔除无关SNPs;Wrapper阶段,使用基于支持向量机的特征递归消减方法(SVM-RFE)筛选出与遗传疾病相关的关键SNPs。实验表明,该方法具有明显优于单独使用SVM-RFE算法的性能,优于单独使用Relief-SVM算法的分类准确率,为SNP全基因组关联分析提供了一种有效途径。  相似文献   

20.
Locked Nucleic Acid's or LNA are a new class of bicyclic DNA analogues that have a high affinity and specificity towards complementary nucleic acids. LNA containing oligonucleotides were used to develop a multiplex SNP genotyping assay based entirely on hybridization between capture probe and target. The approach incorporates a polymer microarray platform, photochemistry for immobilization of oligonucleotides onto microarrays, and a dedicated software tool to aid primer and capture probe design for highly multiplex genotyping. Furthermore, these technologies are combined in an integrated microfluidics platform for simple, highly multiplex and robust SNP genotyping.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号