首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
随着高通量的单核苷酸多态性(Single Nucleotide Polymorphism, SNP)检测技术的发展,世界各地的实验研究积累了大量的SNP数据,但是目前尚无一个全面综合的SNP数据库.SNP在致病基因发现、司法鉴定、个体化医疗等方面的应用得到了极大的关注和发展,因此有必要建立一个整合的人类SNP数据库.在整合中需要进行大规模的单核苷酸多态性位点的验证,该工作通过一个自主开发的、健壮的、用户友好的生物信息学集群计算工具包EasyCluster在集群系统上得以高效完成.  相似文献   

2.
随着高通量的单核苷酸多态性(Single Nucleotide Polymorphism, SNP)检测技术的发展,世界各地的实验研究积累了大量的SNP数据,但是目前尚无一个全面综合的SNP数据库。SNP在致病基因发现、司法鉴定、个体化医疗等方面的应用得到了极大的关注和发展,因此有必要建立一个整合的人类SNP数据库。在整合中需要进行大规模的单核苷酸多态性位点的验证,该工作通过一个自主开发的、健壮的、用户友好的生物信息学集群计算工具包EasyCluster在集群系统上得以高效完成。  相似文献   

3.
采用主成分分析方法(PCA)定义了简单的数学模型和轴向确定方法等来实现配准.大量实验证明,算法能够快速实现任意形状、大小及位置的两片点云配准.  相似文献   

4.
SNP(单核苷酸多态性)是发生在DNA序列上单个核苷酸碱基之间的变异,是生物可遗传变异中最常见的一种变异。ED算法和SNP-index算法是计算SNP位点的2种常用算法。由高通量测序获得拟南芥F2代全基因组测序数据,基于Linux平台对测序数据进行过滤、筛选和比对,通过算法实现结果,比较不同算法检测得到的SNP位点数量和SNP基因型比例。实验结果表明,通过ED算法得到的SNP位点数量更多,分布更广,相对分布密度大于SNP-index算法的,但是2种算法得到的SNP位点数量和SNP基因型比例相近。  相似文献   

5.
赵婧  魏彬  张瑾 《计算机科学》2016,43(Z6):219-221, 235
作为第三代遗传标记的单核苷酸多态性(SNP)具有数量众多、分布广泛且遗传稳定性等特点,其是疾病-基因相关性以及药物设计等研究的基础所在。这类研究多采用基于计算的方法,因此如何对SNP进行适当的编码进而提升算法的性能是其中十分关键的一个环节,然而目前专门针对SNP编码问题的研究还相对较少。在常用SNP表示方式的基础上,根据疾病易感性研究的特点,并结合SNP之间的关联性,提出了几种新的编码方法。大量实验表明,编码方式对疾病易感性分析算法的性能有着较大的影响,基于分布信息的编码方法能获得更好的结果,即其能更好地对SNP序列进行描述,在最大程度上保留原有生物序列所携带的丰富信息,更适合于疾病易感性研究。  相似文献   

6.
《计算机工程》2018,(3):42-46
目前的多基因组比对算法需要大量时间和内存开销,多基因组索引(MuGI)的比对算法速度较快,但未能利用多基因组重复信息。为此,提出一种改进的MuGI索引比对算法。运用带单核苷酸多态性剪枝的动态种子扩展算法及多基因组的重复信息,提高比对速度。同时采用按需读取索引的内存管理策略,提高算法的空间效率。实验结果表明,改进算法仅需6 GB运行内存,即可在1 092人基因组上进行比对,并且误配阈值为5的比对速度为MuGI算法的3倍左右。  相似文献   

7.
李平  杨洪斌  吴悦 《计算机工程》2013,39(1):309-312
cnvPartition算法在单核苷酸多态性数据上运算时间复杂度较高。为此,提出一种改进的基因拷贝数变异(CNV)检测算法。将二元分割与cnvPartition算法相结合,优先查找显著变异断点,再检测出隐藏性变异断点。实验结果表明,该算法在位点数增加时,最高可提高50%的检测速度,利于检测出小片段的CNV变异。  相似文献   

8.
一种RVM模糊模型辨识方法及在故障预报中的应用   总被引:2,自引:0,他引:2  
对复杂、病态、非线性动态系统进行故障预报的重点和难点是建立系统故障状况的数学模型, 通常难以建立精确的数学模型, 相比之下构建其模糊模型是一个有效途径. 本文研究了相关向量机(Relevance vector machine, RVM)与模糊推理系统(Fuzzy inference system, FIS)之间的内在联系, 证明了基于RVM的FIS具有一致逼近性, 并提出了一种基于RVM和梯度下降(Gradient descent, GD) 算法的模糊模型辨识方法. 基于所给出的模糊模型辨识方法提出了一种新的故障预报算法. 仿真结果表明所建立的模糊模型不仅结构更加简单, 而且能达到更高的预测精度, 所提出的故障预报算法能准确地预报系统故障.  相似文献   

9.
基于FP-Tree的最大频繁项目集挖掘及更新算法   总被引:105,自引:2,他引:105       下载免费PDF全文
宋余庆  朱玉全  孙志挥  陈耿 《软件学报》2003,14(9):1586-1592
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用.  相似文献   

10.
一种基于前缀广义表的关联规则增量式更新算法   总被引:20,自引:1,他引:20  
杨明  孙志挥 《计算机学报》2003,26(10):1318-1325
关联规则挖掘是数据挖掘研究的一个重要方面,关联规则的高效维护算法研究是当前研究的热点.传统更新算法与Apriori算法框架一致,要多遍扫描数据库并产生大量的候选项目集.为此,该文对FP-tree进行了改进,引入了前缀广义表——PG-List,并提出了基于PG-List的关联规则挖掘(MARBPGL)与增量式更新算法(IUABPGL).算法MARBPGL仅须扫描数据库两遍,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍,扫描新增数据库两遍,且两个算法均无须生成候选项目集,避免了产生“知识的组合爆炸”,提高了挖掘和维护的效率.理论分析和实验结果表明该文提出的算法是有效可行的.  相似文献   

11.
SNP功能分析的生物信息学方法及其资源   总被引:3,自引:0,他引:3  
在后基因组时代,单核苷酸多态性 (Single Nucleotide Polymorphism,SNP) 数据的快速积累使得用计算方法对编码区和非编码区SNP进行功能分析成为可能;但是目前各种SNP功能预测方法的预测精度均不能令人满意.针对这一问题,文章根据SNP的分类,分别对错义SNP、同义SNP和非编码区SNP功能分析的生物信息学方法进行了总结.其中重点介绍了基于序列特征和基于结构特征的有害错义SNP预测方法.还介绍了互联网上提供SNP资源和功能注释工具.分析表明,各种SNP功能分析方法还有很大的改进余地.  相似文献   

12.
TagSNP selection, which aims to select a small subset of informative single nucleotide polymorphisms (SNPs) to represent the whole large SNP set, has played an important role in current genomic research. Not only can this cut down the cost of genotyping by filtering a large number of redundant SNPs, but also it can accelerate the study of genome-wide disease association. In this paper, we propose a new hybrid method called CMDStagger that combines the ideas of the clustering and the graph algorithm, to find the minimum set of tagSNPs. The proposed algorithm uses the information of the linkage disequilibrium association and the haplotype diversity to reduce the information loss in tagSNP selection, and has no limit of block partition. The approach is tested on eight benchmark datasets from Hapmap and chromosome 5q31. Experimental results show that the algorithm in this paper can reduce the selection time and obtain less tagSNPs with high prediction accuracy. It indicates that this method has better performance than previous ones.  相似文献   

13.
A single nucleotide polymorphism (SNP), as the most common form of genetic variation, has been widely studied to help analyze the possible association between diseases and genomes. To gain more information, SNPs on a single chromosome are usually studied together, which constitute a haplotype. Gaining haplotypes from biological experiments is usually very costly and time-consuming, which causes people to develop efficient methods to determine haplotypes from the computational angle. Many problems and algorithms about haplotypes have been proposed to reduce the cost of studies of disease association. In general, four categories of problems are widely researched: the haplotype assembly problem, the haplotype inference problem, the haplotype block partition problem, and the haplotype tagging SNP selection problem. The former two problems have been well reviewed by many researchers, whereas the latter two have not been comprehensively surveyed to our knowledge. In this paper, we try to make a detailed introduction to the four problems, especially the latter two.  相似文献   

14.
Single nucleotide polymorphism (SNP) in human genomes is considered to be highly associated with complex genetic diseases. As a consequence, obtaining all SNPs from human populations is one of the primary goals of recent studies on human genomics. The two sequences of SNPs in diploid human organisms are called haplotypes. In this paper, the problem of haplotype reconstruction from SNP fragments with and without genotype information is studied. Minimum error correction (MEC) is an important model for this problem but only effective when the error rate of the fragments is low. MEC/GI, as an extension to MEC model, employs the related genotype information besides the SNP fragments and, therefore, results in a more accurate inference. We introduce algorithmic neural network-based approaches and experimentally prove that our methods are fast and accurate. Particularly, our approach is faster, more accurate, and also compatible for solving MEC model, in comparison with a feed-forward (and back propagation like) neural network.  相似文献   

15.
As part of human resource management policies and practices, construction firms need to define competency requirements for project staff, and recruit the necessary team for completion of project assignments. Traditionally, potential candidates are interviewed and the most qualified are selected. Applicable methodologies that could take various candidate competencies and inherent uncertainties of human evaluation into consideration and then pinpoint the most qualified person with a high degree of reliability would be beneficial. In the last decade, computing with words (CWW) has been the center of attention of many researchers for its intrinsic capability of dealing with linguistic, vague, interdependent, and imprecise information under uncertain environments. This paper presents a CWW approach, based on the specific architecture of Perceptual Computer (Per-C) and the Linguistic Weighted Average (LWA), for competency based selection of human resources in construction firms. First, human resources are classified into two types of main personnel: project manager and engineer. Then, a hierarchical criteria structure for competency based evaluation of each main personnel category is established upon the available literature and survey. Finally, the perceptual computer approach is utilized to develop a practical model for competency based selection of personnel in construction companies. We believe that the proposed approach provides a useful tool to handle personnel selection problem in a more reliable and intelligent manner.  相似文献   

16.
全基因组关联研究是研究复杂疾病和性状遗传效应的一种有效手段。现有关联分析主要用的是边缘统计检验的方法,但未考虑特征间相关性、阈值选取不稳定等问题。该文以心脑血管疾病为研究对象,提出了一种基于多步筛选法的全基因组关联分析新方法。该方法可以简要概括为以下 两步:首先利用 Gini 指数做特征初始筛选,获得一个候选单核苷酸多态性子集,再用基于随机森林的递归聚类消除法从单核苷酸多态性子集中发现关联单核苷酸多态性。实验结果表明,多步筛选法比单步特征选择的效果更好,基于 Gini 指数的基于随机森林的递归聚类消除法筛选的单核苷酸多态性子集与疾病的关联性更高。  相似文献   

17.
虚拟原型逼真设计作为虚拟产品开发研究的一个方面,是近几年发展起来的新技术,主要研究虚拟环境下的产品建模问题以及基于仿真的集成产品和过程设计问题。生命周期虚拟产品设计方案评价模型是虚拟原型逼真设计模型实现的重要模块之一,论文在设计方案多目标多级模糊综合决策模型的基础上,研究并建立了设计方案ANN多目标决策模型,该模型已应用于仪表新产品开发决策支持系统中。  相似文献   

18.
王朝云  蒋刚毅  郁梅  陈芬 《自动化学报》2016,42(7):1113-1124
图像质量评价(Image quality assessment, IQA)的目标是利用设计的计算模型得到与主观评价一致的结果,而人类视觉感知特性是感知图像质量评价的关键.大量研究发现,认知流形和拓扑连续性是人类感知的基础即人类感知局限在低维流形之上.基于图像低维流形特征分析,本文提出了基于流形特征相似度(Manifold feature similarity, MFS)的全参考图像质量评价方法.首先,利用正交局部保持投影算法来模拟大脑的视觉处理过程获取最佳映射矩阵进而得到图像的低维流形特征,通过流形特征的相似度来表征两幅图像的结构差异,从而反映感知质量上的差异.其次,考虑亮度失真对人眼视觉感知的影响,通过图像块均值计算亮度相似度并用于评价图像的亮度失真;最后,结合两个相似度得到图像的客观质量评价值.在四个公开图像测试库上的实验结果表明,所提出方法与现有代表性的图像质量方法相比总体上具有更好的评价结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号