首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对传统方法在分析DNA序列相似性方面的不足, 提出了一种新的基于信息量的DNA序列相似性分析算法, 该方法将DNA序列视为基于符号集{A, C, G, T}的信号序列, 全部待比较的DNA序列组合成一个以字符A、C、G、T为属性值的信息系统。在所得数据库系统中引进DNA序列的信息量、联合信息量、条件信息量、交互信息量等概念, 讨论这些信息量的性质并给出它们之间的一些关系式, 然后在此基础上构建DNA序列相似性分析模型。仿真实验结果表明, 该方法不但能快速、有效地分析DNA序列相似性, 而且较好地克服了DNA碱基数量很大且不同物种的DNA序列长短不同的不足。  相似文献   

2.
提出了一种新的DNA序列的3D图形表示方法,该方法能体现较多的DNA序列的特征,而且避免了信息的丢失。为了进行DNA序列之间的相似性分析,在此方法的基础上对图形进行特征提取并利用高维数据降维算法对提取后的高维数据进行降维,并降到3维,降维后的数据不但保持了原有高维数据的特征而且能很方便地观察它们之间的关系。通过对10个物种的β-球蛋白基因的第一个外显子的相似性分析,得到了较好的结果。  相似文献   

3.
DNA序列相似性分析是生物信息学中最主要的内容之一,它的研究对于发现物种间的进化关系、判断血缘关系、治疗疾病等有着至关重要的作用。利用图形表示方式来分析DNA序列相似性时,局部差异是反映相似性的重要内容,但某些局部差异累积会导致本来十分相似的DNA序列在全局上呈现出较大的差异,从而导致误判。根据这一思想,本文提出基于SDTW算法的DNA序列相似性分析,该算法通过合理的分段既保持了局部差异的作用又在一定程度上控制了局部差异对全局差异的影响范围。文中以9个物种β-球蛋白第一个外显子的编码序列作为分析对象,将该算法与已有算法的分析结果进行比较。结果表明本文提出的算法相似性分析更加准确,分析结果的敏感性较高,有助于提高进化距离较近的分析对象间的区别度,可将其进一步应用于生物序列的信息分析。  相似文献   

4.
用一种新的信息离散性量度法分析DNA序列的相似性。该法用DNA序列的子序列分布来描述DNA序列,从而充分考虑了DNA序列的信息。对不同的子序列长度,分析了11类不同生物的β-globin基因的第一个外显子的编码序列的相似性,结果表明,该法是分析DNA序列相似性的简单而有效的工具。  相似文献   

5.
序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义.序列相似性算法包括基于序列比对的方法及非比对方法两种.基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异.因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量.使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合.通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性.  相似文献   

6.
基于数据挖掘的符号序列聚类相似度量模型   总被引:1,自引:1,他引:1       下载免费PDF全文
为了从消费者偏好序列中发现市场细分结构,采用数据挖掘领域中的符号序列聚类方法,提出一种符号序列聚类的研究方法和框架,给出RSM相似性度量模型。调整RSM模型参数,使得RSM可以变为与编辑距离、海明距离等价的相似性度量。通过RSM与其他序列相似性度量的比较,表明RSM具有更强的表达相似性概念的能力。由于RSM能够表达不同的相似性概念,从而使之能适用于不同的应用环境,并在其基础上提出自组织特征映射退火符号聚类模型,使得从消费者偏好进行市场细分结构研究的研究途径在实际应用中得以实现。  相似文献   

7.
基于符号动力学原理,提出了一种新的RNA二级结构序列的图形表示方法.通过生物信息和自由能两种信息,该图形表示方法将RNA二级结构序列中的自由基和碱基对分别映射成两类时间序列.这种映射方法不仅能够在转换过程中不丢失任何数据信息,而且在二维图形中也能够清楚地识别配对碱基所在的区域.基于该图形表示方法对二级结构的表示结果构建特征矩阵.进一步由该特征矩阵的最大特征值组成用于相似性分析的向量.采用新的相似性分析方法,分别从时域和频域对不同病毒在3’末端的RNA二级结构序列集合进行定性和定量的相似度分析.仿真结果表明,该方法能够有效地实现RNA二级结构序列的相似度分析.与其他方法相比,新方法所得结果中数值差值较大,有利于区分不同物种.  相似文献   

8.
针对DNA计算中的DNA序列设计问题,基于6个DNA序列设计约束条件,将DNA序列设计问题转化为多目标优化问题,提出小生境遗传算法进行求解。算法利用DNA序列设计中的相似性约束与H-测度约束,在单链DNA序列集合上定义共享函数,利用两种类型的编码等价变换以及模4算术运算,构造了5个遗传算子,并给出具体的DNA序列设计结果。通过比较,算法可以得到质量更好的DNA序列,且在种群规模与进化代数方面具有更高的计算效率。  相似文献   

9.
DNA计算中核酸序列设计方法比较研究   总被引:2,自引:0,他引:2  
DNA计算是将现实问题进行编码,映射到DNA分子上,然后通过分子生物实验产生出代表问题解的DNA分子,最后通过检测技术提取出该DNA分子.高质量的DNA编码可以尽可能避免或减少计算过程中出现的错误,并使检测阶段易于提取出代表问题解的DNA分子.文中对基于汉明距离和基于自由能的DNA核酸编码方法进行研究,分析了两类方法的约束条件对DNA编码质量的影响,比较了两类方法排除非特异性杂交的完备性和计算量,进一步分析了两类方法编码DNA序列的效率.通过分析和比较得到,两类DNA计算编码方法都能有效地限制DNA分子间的非特异性杂交,其中基于汉明距离的DNA编码方法的计算量比较小,但是它仅能近似地估计DNA分子间杂交的热力学稳定性,不能完全替代最小自由能的编码方法.在满足DNA计算试验精度要求的条件下,采用基于汉明距离的DNA编码设计方法不仅能有效地的挑选出特异性杂交和非特异性杂交的DNA序列,还能有效地减少计算量,从而提高DNA序列设计的效率.  相似文献   

10.
平面设计是以图形符号作为手段传达信息,是一个将创意视觉化、符号化的过程,思维根据设计意象对视觉元素进行挑选、变换、组合,将视觉元素进行有机的关联、编码,使之形成特定的符号系统。图形、文字设计作为视觉空间设计中的一种符号现象,起着沟通人们与文化、信息的作用。因此,我们应该对此进行研究与认识,发掘更多的符号特性,更准确的运用符号学原理来进行平面图形设计。  相似文献   

11.
In bioinformatics and computational biology, methods for biological sequence comparison play the most important role for the interpretation of complex nucleotide and protein data such as the inference of relationships between genes, proteins and species; and the discovery of novel protein structures and functions. This type of inference is derived by sequence similarity matching on the databases of biological sequences. As many entire genomes have being determined at a rapid rate, computational methods for comparing genomic and protein sequences will be more essential for probing the complexity of genes, genomes, and molecular machines. In this paper we introduce a pattern-comparison algorithm, which is based on the mathematical concepts of linear predictive coding and its cepstral-distortion measures for the analyses of both DNA and protein sequences. The results obtained from several experiments on real datasets have shown the effectiveness of the proposed approach.  相似文献   

12.
13.
DNA编码问题及其复杂性研究   总被引:1,自引:0,他引:1  
高质量的DNA编码可以避免DNA分子间的非特异性杂交,提高DNA计算的有效性和可靠性。首先对DNA编码的约束条件进行归类,分析了各编码约束对编码质量的影响;然后研究了编码质量、编码数量、序列长度与DNA计算可靠性、有效性、可扩充性之间的关系;最后通过类比DNA编码问题和图的独立集问题,说明了求解最大DNA序列集合问题是NP完全的。  相似文献   

14.
提出一种新的在DNA和RNA中隐藏信息的方法,以此可以保护基因的新发现、基因治疗药物等的知识产权.该方法综合了密码子冗余和算术编码,在DNA活跃的译码部分进行信息隐藏而不改变最终的氨基酸序列.  相似文献   

15.
基于字典的DNA序列压缩算法研究及应用*   总被引:1,自引:0,他引:1  
在现有DNA序列数据压缩算法的基础上,以DNA序列数据的存储效率及生物学解释综合考虑,设计并实现了基于字典的DNA序列压缩算法DNADCompress.算法核心包括重复子串字典建立、字典项筛选、字串压缩编码三方面.实验数据表明,数据压缩算法压缩效果达到常用DNA序列压缩算法水平,并为序列生物学解释提供了基础.  相似文献   

16.
Encoding and processing information in DNA-, RNA- and other biomolecule-based devices is an important requirement for DNA based computing with potentially important applications. To make DNA computing more reliable, much work has focused on designing the good DNA sequences. However, this is a bothersome task as encoding problem is an NP problem. In this paper, a new methodology based on the IWO algorithm is developed to optimize encoding sequences. Firstly, the mathematics models of constrained objective optimization design for encoding problems based on the thermodynamic criteria are set up. Then, a modified IWO method is developed by defining the colonizing behavior of weeds to overcome the obstacles of the original IWO algorithm, which cannot be applied to discrete problems directly. The experimental results show that the proposed method is effective and convenient for the user to design and select effective DNA sequences in silicon for controllable DNA computing.  相似文献   

17.
DNA计算是将现实问题进行编码映射到DNA分子上,通过生物实验产生出代表问题的解的DNA分子,最后通过检测技术提取出该DNA分子。高质量的DNA编码可以尽可能避免或减少计算过程中出现的错误,并使检测阶段易于提取出代表问题的解的DNA分子。对DNA编码约束进行了研究,分析了基于汉明距离的编码约束可以有效降低DNA分子间相似程度,减少DNA计算过程中DNA分子间的相互干扰,从而提高DNA计算的有效性和可靠性。还证明了基于汉明距离的编码约束存在等价的序列组合,降低了编码计算的复杂度。  相似文献   

18.
We recently introduced evolutive tandem repeats with jump (using Hamming distance) (Proc. MFCS’02: the 27th Internat. Symp. Mathematical Foundations of Computer Science, Warszawa, Otwock, Poland, August 2002, Lecture Notes in Computer Science, Vol. 2420, Springer, Berlin, pp. 292–304) which consist in a series of almost contiguous copies having the following property: the Hamming distance between two consecutive copies is always smaller than a given parameter e. In this article, we present a significative improvement that speeds up the detection of evolutive tandem repeats. It is based on the progressive computation of distances between candidate copies participating to the evolutive tandem repeat. It leads to a new algorithm, still quadratic in the worst case, but much more efficient on average, authorizing larger sequences to be processed.  相似文献   

19.
A functional machine is not only an assembly of parts, but also an assembly of processes. The processing of each part must obey laws that respect to the property of this part. For example, building any kind of computer entails selecting appropriate components and assembling their properties to function in computation. Here, we describe computation using a DNA strand as the basic unit and we have used this unit to achieve the function of multiplication. We exploit the phenomenon of DNA hybridization, in which each strand can represent two individual units that can pair to form a single unit. We represent the numbers we multiply in binary, with different lengths representing each digit present in the number. In principle, all combinations of the numbers will be present in solution. Following hybridization, there is present a collection of duplex molecules that are tailed by single-stranded ends. These intermediates are converted to fully duplex molecules by filling in the ends with DNA polymerase. The lengths that are present represent the digits that are present, and they may be separated by denaturing PAGE. The results give a series of bands for each power of two. The number of bands in the size domain for a particular power of two is converted to binary and the sum of all present bands is then added together. Experimentally, the result of this process always yields the correct answer.  相似文献   

20.
为有效发现DNA数据是否被恶意篡改,保证研究者所使用的DNA数据是真实可靠的,即未经过篡改的,本文提出一种基于数字签名的DNA数据篡改提示方法,用向原有信息中加入数字签名的方法来解决该问题.设计了一整套加入、检测以及滤除签名的方法.该方法将数字签名嵌入DNA序列,在使用前通过校验数字签名来发现DNA是否篡改,以便给出篡改提示.实验表明,该方法可以有效发现篡改者对序列的恶意篡改,而且经添加签名后的序列与原始序列有一定的相似性,不易引起篡改者的注意.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号