首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过将蛋白质图形表示中的迭代函数推广到高维空间,提出了一种适用范围更加广泛的广义迭代函数,该函数能反映空间中坐标不同压缩比例与不同氨基酸残基理化性质参数。应用该广义迭代函数和氨基酸残基的某些理化指标,得到了一种新的蛋白质序列图形表示。研究结果表明,该图形表示反映了对应蛋白质序列的主要信息。应用该蛋白质图形表示方法和相应的数值刻画,比较了10种物种的ND5蛋白质序列相似性,并分析这些物种的进化关系。与经典的蛋白质多重序列比对ClustalW方法的比较结果表明,该方法对蛋白序列相似性比较和物种进化分析是可靠且有效的。  相似文献   

2.
基于DNA序列的chaos game representation(CGR)图形表示,文中给出了一种新的蛋白质序列的3D空间表示,其空间曲线的x、y轴坐标由Randic文章中的方法得到,z轴坐标由蛋白质序列中氨基酸的累积个数得到。蛋白质序列的3D空间表示得到的曲线比Randic的2D图形表示具有更好的可视性。利用不同的数学方法,对所得到的曲线进行了数值刻画;基于得到的数值刻画,比较了9个不同物种的线粒体NADH脱氢酶的相似性。  相似文献   

3.
利用神经网络和蛋白质全序列对蛋白质结构类进行了预测.按照蛋白质序列的长度,分别从508个蛋白质中选择244个蛋白质构建了3个数据集,3个数据集中蛋白质序列的长度变化范围分别为50,100和150个氨基酸.3个数据集的自检结果均为100%.数据集的留一检测结果分别为97.13%,95.90%和95.49%.3个数据集中最好的10倍交叉检验结果为82.38%.结果表明,数据集的序列长度变化范围对预测准确率有很大影响,序列长度变化范围越大准确率越低.  相似文献   

4.
蛋白质二硫键的分布特征   总被引:2,自引:0,他引:2  
以SLCTBASE数据库中包含二硫键的215条多肽链作为研究对象,统计分析了二硫键的分布特征,结果表明,二硫键的分布很不均匀,主要在序列距离较近的2个半胱氨酸之间形成,大部分二硫键是在序列距离小于70个氨基酸的地方形成,并且对某些序列距离有着强烈的偏好,这一结果对蛋白南工程中引入人工二硫键、进行分子生物学实验设计具有一定参考意义。  相似文献   

5.
应用对数关联距离与互信息距离加权的方法,对完全基因组DNA序列和蛋白质序列构建了30种细小病毒系统发育树。构建的发育树均将30种细小病毒分成细小病毒亚科和浓核病毒亚科两个大的分枝,其结构与国际病毒学分类委员会第八版报道的结果及已有文献的结果基本一致。且基于蛋白质序列构建的系统发育树比基于完全基因组DNA序列构建的要好。  相似文献   

6.
生物信息资源更新越来越快,使用可视化的方法来分析DNA序列已成为生物信息学的一个研究热点,用图形表示DNA序列的方法越来越成熟。基于DNA序列的3D图形表示法,提出一种新的进化树构造方法:将DNA基本序列表示成空间3D图形,并计算与序列相对应的非负实对称矩阵;计算新的特征参数C表征序列特性,并获得相对进化距离;基于可凝聚的层次聚类算法构造不同基因序列的进化树。采用中国不同地区的12组禽流感基因HA(H5N1)序列进行试验,最后获得了相应的进化关系。  相似文献   

7.
嗜盐菌AB3中细菌视紫红质和系统发育研究   总被引:4,自引:1,他引:4  
为了研究分析嗜盐古生菌物种与细菌视紫红质(BR)蛋白基因资源,分离纯化得到极端嗜盐古生菌AB3. 采用聚合酶链式反应(PCR)方法对其编码螺旋C至螺旋G的蛋白基因片断和16S rRNA基因进行了扩增,并测定了基因的核苷酸序列. 翻译出的氨基酸序列与已报道的相应片断进行对比,AB3中的螺旋C至螺旋G蛋白与其他菌株差异显著.基于BR蛋白和16S rDNA序列的同源性比较以及系统发育学研究表明,AB3是Natrinema属中的新成员. 菌株AB3的16S rDNA序列已被GenBank数据库收录,其序列号为AY277583.  相似文献   

8.
基于丹参EST数据库,以烟草S-腺苷甲硫氨酸脱羧酶基因(SAMDC)cDNA序列为信息探针,进行同源搜索,经同源比对和序列组装,分离得到1个新的植物SAMDC基因家族成员,命名为SmSAMDC,全长1620bp,经RT-PCR扩增,分子克隆和序列分析验证,结果表明与电子克隆完全一致。该cDNA序列具有完整的开放阅读框架,存在3个植物SAMDC基因特征ORF(tiny ORF、small ORF及main ORF);main ORF编码蛋白质理论分子量为39.4kD、pI为4.71,均与植物SAMDC酶原蛋白相近。二级结构预测发现,SmSAMDC基因main ORF编码序列中25.28%的氨基酸残基构成α螺旋、24.17%的氨基酸残基构成延伸链、50.56%的氨基酸残基构成随机卷曲。氨基酸序列比对分析结果表明,SmSAMDC与已知植物SAMDC基因家族成员高度同源,具有植物SAMDC基因家族的酶原剪切位点及SAMDC蛋白快速降解相关PEST保守结构域。  相似文献   

9.
采用生物信息学方法对人CYP2E1基因编码蛋白质的结构、理化性质、亲疏水性、信号肽、跨膜结构域、亚细胞定位、二级结构、三级结构、酶活性中心等进行预测,并对人和其他6物种的CYP2E1编码蛋白序列进行系统进化分析.研究结果表明,人CYP2E1编码493个氨基酸组成多肽,其相对分子质量约为172 386.6,等电点理论值为7.04,分子式为C6778H10986N2074O2429S374.该蛋白定位于细胞膜外,属跨膜蛋白,为疏水性不稳定蛋白;该蛋白二级结构有6个β折叠、6个α-螺旋、6个跨膜结构区和32个转角,该酶活性中心由Asn202残基、Ser298残基及Phe205残基与铁卟啉环构成,CYP2E1蛋白血红素铁和底物催化位点之间的距离在0.3~0.6 nm之间.  相似文献   

10.
Hausdorff距离是计算几何中的重要概念之一,由于Hausdorff距离是一个极大极小距离,所以我们可以根据两个物体之间的Hausdorff距离来测量它们的相似或者不匹配程度.Hausdorff距离在计算机图形学研究、计算机辅助几何设计、模式识别、图像处理、地形辅助导航系统和运动物体视觉分析中得到广泛应用.前人有关Hausdorff距离的工作基本上都是在参数曲线曲面的范围内解决的.由于代数曲线的特殊性,一般很难进行参数化导致代数曲线的Hausdorff距离计算问题一直未得到解决.笔者借助于区间算术和细分算法针对代数曲线之间的Hausdorff距离计算问题提出了一种新的解决方法.  相似文献   

11.
本文从NCBI数据库中检索得到Burkholderia phytofirmans PsJN的两个阿魏酸酯酶基因序列,分别标记为BpfaeI和Bpfae2,运用生物信息学方法对其核苷酸序列、编码的氨基酸序列进行分析,并对其二级和三级结构进行预测。结果表明,Bpfael的基因全长为1671bp,该基因编码的氨基酸为556aa,此蛋白质的等电点为8.33,分子量为59978.22Da。Bpfae2的基因全长为1734bp,该基因编码的氨基酸为577aa,此蛋白质的等电点5.42,分子量为59339.25Da。序列比对结果表明,Bpfael与Burkholderia xenovorans同源性最高为90%。Bpfae2与Burkholderia glumae同源性最高为83%,这两个阿魏酸酯酶蛋白的同源率为29%。另外对这两个阿魏酸酯酶的立体结构进行了同源模拟。  相似文献   

12.
拟建立Th细胞表位预测的自动化、程序化方法。从多肽序列的一级结构出发,将各氨基酸侧链看成一个整体即拟原子,并基于多肽序列中氨基酸侧链间距离和氨基酸侧链的电性特征,构建了能描述多肽序列结构行征的序列特征矢量,简称ζ矢量。选取文献中MHC限制性为14个A^d限制性和14个非A^d限制性多肽序列,分别定义为活性和非活性肽,并以之作为训练集来建立Th细胞表位预测的定量模型。为检验该预报系统的精确性,进行了随机抽样检验和交互检验,结果表明,该预报系统具有稳定性好、预测能力强的特点,该方法还可推广用于人的MHC Ⅰ、Ⅱ类表位的预测研究,可望在蛋白质抗原免疫识别、亚单位疫苗分子设计及研制中发挥重要作用。  相似文献   

13.
用图形法表示生物分子序列是生物信息学的一个重要研究课题,其中RNA二级结构以廖波提出的三维图形表示法应用比较广泛。在该算法的基础上,对二级结构中的自由基进行进一步划分,划分为假结内自由基和假结外自由基,并以此为基础提出了一种新的RNA二级结构三维图形表示法。将此表示法应用在随机抽取的5种含有假结的RNA分子上,可以有效地计算出它们之间的相似度。  相似文献   

14.
提出一种基于自注意力机制和傅立叶变换的序列推荐算法CSFTRec。通过过滤原始数据中的噪声,最大限度地提高自注意力机制对序列数据的特征捕捉能力。根据对比学习的特点,在贝叶斯个性化排名的基础上引入一种新的对比损失,用于联合训练,可以缩短不同相似序列之间的距离。在8个公共数据集上的实验表明,CSFTRec的收敛速度更快,推荐精度有3%~5%的提高,更适合处理序列数据。  相似文献   

15.
利用从青岛近海发现的一株高产琼胶酶的假别单胞菌CY24(Pseudoaltero-monassp.CY24)建立基因组DNA文库后,用水解圈的方法从中筛选到一个具有琼胶酶活性的阳性克隆pBA1。pBA1的序列分析结果表明,插入DNA片段的长度为6.7 kb,含有4个推测读码框架,并利用亚克隆法确定了琼胶酶的编码基因agaB。agaB基因的开放阅读框架为1 437 bp,编码478个氨基酸,理论分子量为50.9 kDa,在N末端有一个包含38个氨基酸的信号肽。推测的成熟蛋白质的分子量和等电点分别为47.2 kDa和4.83。AgaB的氨基酸序列与已知蛋白质包括所有的糖苷水解酶序列完全没有相似性;HCA的蛋白质二级结构分析结果表明,AgaB不同于其他已知琼胶酶。因此,推测AgaB为一新型的琼胶酶,代表一个新的糖苷水解酶家族。  相似文献   

16.
蛋白质相互作用在生命活动中起着核心作用,蛋白质复合体亚基的结合是蛋白质相互作用的一种重要形式.由于实验方法耗时耗力,因此从理论上预测蛋白质相互作用有着特殊的意义.首先对蛋白质复合体的结合区统计其二级结构、超二级结构和二级结构组合的频数,以及这些结构占整个蛋白质氨基酸链中各类统计数目的百分比,得到各类型结构出现在结合区的相对倾向值.而后,根据相对倾向值给出相结合的两个蛋白亚基的氨基酸链的打分规则.选取64个氨基酸长度为标准滑动窗口,以1为步长,将每一对蛋白链得到一组分值作为特征值输入支持向量机,构建模型.用10折交叉检验评价其预测能力,得到整体准确率、敏感性、阳性预测值和相关系数分别是64.52%、66.87%,63.92%和0.291.这表明本方法有一定的区分度,用于预测蛋白质亚基相互作用是可行的.  相似文献   

17.
采用高效液相色谱法测定6株米曲霉菌株发酵液中的草甘膦降解情况,结果表明米曲霉(Aspergillus oryzae)A-FEC04的草甘膦降解率最高,为12.5%。提取6株米曲霉菌株的基因组DNA,PCR扩增后得到甘氨酸氧化酶序列,测序结果发现只有米曲霉A-FEC04发生部分基因突变。米曲霉(Aspergillus oryzae)A-FEC04的ORF DNA序列全长1 263 bp,编码一个由420个氨基酸组成的蛋白质,其理论分子量为46 965.5 Da,理论等电点为5.85,为弱酸性蛋白。对该氨基酸序列进行结构域架构分析,结果表明该序列具有明显的D-氨基酸氧化酶结构域。更多还原  相似文献   

18.
为克隆黄花苜蓿铁蛋白基因,根据已报道的植物铁蛋白基因序列设计引物,利用RT-PCR法扩增得到大小约为750 bp的特异性片段,并将其克隆到pBlueskript II SK+上.序列分析结果表明,黄花苜蓿铁蛋白基因cDNA全长为756 bp,编码252个氨基酸,与紫花苜蓿铁蛋白基因的核苷酸、氨基酸的同源性均为97%.该基因编码的蛋白质是一个定位在叶绿体上的球形蛋白,理论相对分子质量为28 ku,等电点为5.47,二级结构为α/β混合型蛋白,某些氨基酸在密码子的选择上存在一定的偏向性.该蛋白具有1个FER-RITIN-LIKE功能区、2个铁蛋白基因家族铁结合区域的信号序列、3个潜在的N-糖基化位点、1个蛋白激酶C磷酸化位点、1个依赖于cAMP和cGMP的蛋白激酶磷酸化位点以及3个酪蛋白激酶Ⅱ磷酸化位点等重要的功能基序.黄花苜蓿铁蛋白基因的克隆,为今后利用该基因进行改良植物铁营养成分及提高植物抗氧化胁迫能力的基因工程奠定了基础.  相似文献   

19.
苜蓿叶蛋白中氨基酸的含量及营养分析   总被引:12,自引:0,他引:12  
应用模糊识别法和氨基酸比值系数法,以鸡蛋蛋白质为标准蛋白,以WHO/FAO氨基酸参考模式为评价标准,对苜蓿叶蛋白营养价值进行了全面评价,并与4种叶蛋白进行对照比较.结果表明:苜蓿叶蛋白中总氨基酸含量为56.30%~70.54%,蛋白质中氨基酸种类齐全,必需氨基酸(EAA)占总氨基酸量的40.00%~40.60%,第一限制性氨基酸为赖氨酸,氨基酸比值系数分为78.52~85.76,其叶蛋白营养价值高,是一种值得开发利用的优质植物蛋白.  相似文献   

20.
F/10和G/11木聚糖酶家族的不同热稳定性机制   总被引:2,自引:0,他引:2  
应用生物信息学方法分析了木聚糖酶初级序列中20种氨基酸同其最适温度之间的关系,发现在F/10家族中有正相关作用的氨基酸是w,负相关作用的是A,D,H,S;理论上最高最适温度是119.8℃.在G/ll家族中有正相关作用的氨基酸是L,D,P,Y,负相关作用的是H;理论上最高最适温度为105.6℃.惊奇地发现在不同家族中D起不同的作用,这只能从它们各自不同的蛋白质空间结构上进行解释.从初级序列基础上证明了木聚糖酶的不同蛋白质家族有不同的热稳定性机制.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号