首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
本文继续讨论蛋白质一级结构序列的语义结构,利用组合分析与图论方法讨论Swiss-Prot数据库的组合结构,给出Swiss-Prot数据库中蛋白质一级结构序列的关键词与核心词的定义、搜索算法与特性参数。并由此给出蛋白质一级结构序列的核心词词典.并由此讨论数据库的复杂性问题、同源蛋白质的分类、预测与比对等问题。  相似文献   

2.
基于LZ复杂性距离提出了一种非比对的蛋白质三维结构比较方法.该方法以蛋白质结构单元间的条件LZ复杂性为特征参数,根据条件LZ复杂性计算LZ复杂性距离来作为蛋白质三维结构(不)相似程度的定量刻画.该方法可在二次多项式的时间限度内计算完成.蛋白质的结构数据采用接触图的表示方式,以避免PDB格式数据中的非结构信息和不同坐标系对结构比较的影响.以真实的蛋白质三维结构数据所组成的5个数据集为实例,基于LZ复杂性距离对各数据集中的蛋白质单链进行了结构聚类.聚类的结果符合各蛋白质单链在传统的结构分类数据库中的分类,表明论文提出的方法能够有效地对蛋白质三维结构进行定量比较.  相似文献   

3.
一种基于空间密度特征的蛋白质结构相似性判定方法   总被引:1,自引:0,他引:1  
基于蛋白质分子基本组成元素的空间区域密度特征,进行两种蛋白质结构的一致性比较。对PDB蛋白质数据验证的结果表明,作者所使用的方法可以作为任意结构的蛋白质相似性比较的有效辅助手段。对不具备序列相似性的蛋白质或难以直接抽取几何规则的蛋白质分子之间的相似性比较具有现实意义。  相似文献   

4.
张金伟  曾润颖 《高技术通讯》2007,17(10):1067-1071
从南极普利兹湾深海沉积物中筛选到一株耐冷菌株7197.16S rDNA序列分析表明,该菌株属于假单胞菌属(Pseudomonas).从该菌的全基因组DNA中克隆到编码无机焦磷酸酯酶(PPase)的ppa基因完整的开放阅读框(ORF),其全长为531bp.该基因编码一个由176AA残基组成的分子量预计为19631 Da的PPase蛋白质,其氨基酸序列与Psychrobacter sp.273-4的PPase有97%的相似性,与Neisseria meningitidis Z2491的PPase有79%的相似性,与Mannheimia succiniciproducens MBEL55E的PPase有75%的相似性.  相似文献   

5.
应用生物信息学软件对获得的节旋藻硝酸盐转运蛋白基因(Amnrt P)全长序列进行了结构特征、同源性比较、多序列比对、系统发育学分析等.结果表明:该基因全长为1515 个核苷酸,编码 504 个氨基酸,平均 GC 含量为43.8%,疏水氨基酸的比例为47.6%.该硝酸盐转运蛋白含有 12 个跨膜结构域(Transmembrane domains,Tm),膜拓扑结构与 NRT2 家族的类似,并发现了多个 NRT2 家族的保守序列.同源性搜索显示与属于 NRT2 基因家族的海洋蓝藻的氨基酸序列相似性为75%~89%.采用邻接法(NJ)、最大简约法(MP)和最大似然法(ML)构建了分子系统树,结果表明 3 种树的拓扑结构基本相似,并且在蓝藻中基于硝酸盐转运蛋白基因的系统发育关系与形态学分类结果相一致.所获 Amnrt P 基因属于 NRT2 基因家族,可成为蓝藻系统进化研究的分子标记,并为了解节旋藻中硝酸盐吸收与转运的基因结构和分子机制奠定了一定的基础.  相似文献   

6.
通过根据糖海带(Laminaria saccharina)叶绿素 a/c 结合蛋白基因 lhcf6 的 cDNA 序列设计的引物和 PCR 方法获得了海带(L.japonica)配子体 llwf6 基因的 cDNA 全长序列(GenBank 登录号:DQ250739).该序列的开放阅读框(ORF)与糖海带 lhcf6 编码序列的相似性高达 99%,而两非翻译区(UTR)序列的相似性只有94%.经推测,海带配子体 lhcf6基因序列的 ORF 编码一个含 218 个氨基酸的前体蛋白 LHCF6,其氨基端的 40 个氨基酸组成跨质体内质网和叶绿体膜的信号肽,跨膜酶切后变为含 178 个氨基酸的成熟蛋白,它的分子量为 19.3 kD,等电点为 4.88.预测的成熟蛋白 IJ-ICF6 高级结构存在 2 个保守性的β折叠和 3 个跨类囊体膜的 a 螺旋区.根据海带配子体 LHCF6 成熟蛋白以及 GenBank 中 12 个同源蛋白质的氨基酸序列所构建的 Neighbor-joining 分子进化树,显示藻类在光捕获蛋白氨基酸序列水平上存在着蓝藻与红藻、杂色藻类、裸藻与绿藻等三个方向的演化途径,其中裸藻和绿藻与高等植物的亲缘关系更近.  相似文献   

7.
根据美国国立生物技术信息中心(NCBI)中基因库(GenBank)里查询到已登录的小鼠、大鼠的Tim-1mRNA序列,通过同源比较,设计引物,首次对长爪沙鼠Tim-1基因部分编码序列进行分子克隆.经过PCR扩增,获得长爪沙鼠Tim-1基因243bp部分编码序列,经测序后登录GenBank(JN628997),发现该序列与小鼠、大鼠Tim-1相应部分有80%以上的相似性.利用所克隆的序列设计引物,建立荧光定量PCR方法检测长爪沙鼠Tim-1基因在不同组织中表达情况.结果显示,长爪沙鼠Tim-1基因在不同组织中表达差异性较大,其中在肾脏组织中表达水平高于其他组织,在肌肉、心脏、小肠、脾脏、肝脏、肺组织中表达均较低.  相似文献   

8.
在哈维氏弧菌TS-628菌株鞭毛丝蛋白FlaA基因末端加上一段编码Flag短肽的核苷酸序列作为检测标记后,将该基因克隆到真核表达载体pcDNA3.1( ),酶切、PCR扩增及重组质粒测序证实基因片段插入正确,将该重组质粒命名为pcFlaA.将pcFlaA以肌肉注射方式免疫青石斑鱼.免疫后第7天开始检测鞭毛丝蛋白在石斑鱼肌肉中的表达状况,之后每隔1周检测1次,共检测4次.首先采用PCR技术在DNA水平检测重组质粒转染石斑鱼肌肉细胞的情况,再以RT-PCR法在mRNA水平上检测转染质粒在鱼肌肉中的转录,最后以免疫组化染色技术在蛋白质水平上检测目的蛋白的表达.结果在DNA及mRNA水平上均可检测到目的条带,在蛋白质水平上可检测到明显阳性位点,由此证实pcFlaA可以转染石斑鱼肌肉细胞并可在其中进行表达,而且质粒在鱼体内持续表达的时间至少1个月.  相似文献   

9.
蛋白质的相似性比较是研究蛋白质结构和功能的重要手段。与以往基于构建距离矩阵来研究蛋白质空间结构相似性的方法不同,文章从蛋白质的基本组成单元——氨基酸入手,通过对氨基酸以及蛋白质多肽链中的特殊结构的分析,综合考虑骨架原子Cα数、突变原子数、亲水微粒数、螺旋数四个方面,依托模糊数学等价矩阵理论,运用传递闭包的方法,提出了一种全新的相似性比较与分类方法。  相似文献   

10.
基于SQL Server的蛋白质二级结构预测样本集数据库的构建   总被引:1,自引:1,他引:0  
张宁  吴捷  宋卓  张涛 《高技术通讯》2006,16(6):619-623
基于SQL Server数据库管理系统,将蛋白质二级结构预测的样本集CB513、CB396和RS126组织起来,建立了数据库DataSet,并配置了一个IIS服务器以方便网络查询.该数据库将蛋白质二级结构预测样本集有效地组织起来,实现了规范化、结构化统一管理,便于存储、检索和分析数据,减少错误的发生.通过该数据库可以提取供蛋白质二级结构预测研究的样本、序列转换、变换编码以及分析评价预测结果等,取代许多传统编程处理文本文件的繁琐工作,大大提高效率,促进工作的开展.  相似文献   

11.
沈世镒 《工程数学学报》2004,21(5):665-674,679
生物序列(如DNA、RNA与蛋白质一级结构序列等)都是由一系列小分子团(如核苷酸、氨基酸等)排列组成,如把这些小分子团作为符号单元,那么这些生物序列就是生物序列就是生物学的语言文字,对这些语言文字的结构分析为生物序列的语义分析。生物序列语义分析的内容包括词法与语法的分析,它们是在分子水平基础上的生物语言分析,有关的变化规则我们称之为生物序列中的第二密码规则。本文以Swiss-Prot数据库为基础,利用频率统计、组合分析与信息的度量关系等数学工具,分析蛋白质一级结构序列中的词法规则,给出了关于蛋白质一级结构序列的几种稳定性的度量指标及其相应的稳定性理论,并探讨了它们在蛋白质演变与蛋白质工程中可能产生的应用。  相似文献   

12.
p53蛋白在人体肿瘤当中具有重要作用,它已成为癌症治疗的焦点.本文利用数学中模糊综合评价的方法通过建立隶属函数,对人类TP53、TP63以及TP73的mRNA序列及其蛋白质序列进行了分析,讨论了以不同碱基(a,c,g'u(t))结尾的密码子对它们的氨基酸亲疏水性的影响程度.结果表明:以碱基c结尾的密码子对TP53、TP63和TP73的氨基酸的亲疏水性的影响程度为非常强,以碱基u(t)结尾的密码子对其影响程度为强,以碱基g结尾的密码子对其影响程度为中,以碱基a结尾的密码子对其影响程度为弱.  相似文献   

13.
基于遗传算法的传感器优化配置   总被引:11,自引:2,他引:11  
黄维平  刘娟  李华军 《工程力学》2005,22(1):113-117
讨论了以损伤诊断为目标的传感器优化配置问题,以模态置信度MAC矩阵的最大非对角元为目标函数,将目标函数的极小化问题转换为适应度函数的最大化问题,采用遗传算法对传感器的配置进行组合优化,针对满足组合优化中的约束条件问题提出了二重结构编码遗传算法,取得了满意的优化结果。算例表明,该方法应用于海洋平台模型损伤诊断的传感器优化配置是可行的,其结果优于序列法。  相似文献   

14.
节旋藻FACHB341 Rubisco基因部分序列的克隆和分析   总被引:4,自引:0,他引:4  
以节旋藻FACHB34l为材料,对所克隆Rubisco基因进行了核苷酸序列测定和分析,由此推导出相应的氨基酸序列,并与部分其他蓝藻的同源基因进行了同源性分析。结果表明:所克隆DNA片段包含Rubisco大小亚基基因部分序列及rbcX基因序列,长度为2073bp,其中rbcL和rbcX基因之间存在两个转录茎环结构;大小亚基酸性氨基酸和碱性氨基酸的比例分别为13.14%和14.51%,疏水氨基酸的比例为42.16%;rbcL核苷酸序列与集胞藻PCC6803、Prochlorothrix hallandica、聚球藻PCC630l、Agmenellum quadruplicatum和鱼腥藻PCC7120同源序列的相似性分别为91.7%、79.9%、74.8%、77.2%和76.1%;rbcS核苷酸序列与鱼腥藻PCC7120同源序列的相似性为67.6%,而与PCC630l和集胞藻PCC7002同源序列的相似性分别为30.1%和63.8%。  相似文献   

15.
16.
用标准C语言在IBM-PC兼容微机上开发了基于PROSITE数据库检索蛋白质序列功能位点的PPS程序,PROSITE是Bairoch建立的蛋白质功能位点或结构模式的资料库,为蛋白质序列分析和结构功能研究提供了新工具。  相似文献   

17.
从构建的皱纹盘鲍肝肾cDNA文库中筛选到了鲍防御素基因EST.通过序列分析发现该基因的全长cDNA序列编码66个氨基酸残基,其前体由信号肽、前导肽和成熟肽组成.该前体的成熟肽含42个氨基酸(6个Cys),推测分子量为4323Da,等电点为8.02.氨基酸序列同源性分析表明,该多肽与昆虫防御素的相似性较高,最高可达70%.因成熟肽二级结构具有典型的昆虫防御素结构特征,该多肽应属于抗菌肽中的昆虫防御素亚家族,是一种新型抗菌肽,将其命名为鲍防御素hd-def.采用基因组步移法获得了全长4032bp的基因组序列.分析表明,该基因由3个内含子和4个外显子编码组成;3个内含子大小分别为497bp、2357bp和528bp,其中两个内含子存在于编码信号肽的序列中.用鳗弧菌和金黄色葡萄球菌刺激皱纹盘鲍,能诱导hd-def的表达.实验检测了5种组织,发现hd-def基因仅在肝胰腺中表达,具有明显的组织表达特异性;其表达属于诱导型表达,提示该基因可能参与皱纹盘鲍的抗细菌感染.  相似文献   

18.
凋亡相关新基因TFAR19的cDNA克隆、表达和功能研究   总被引:13,自引:0,他引:13  
利用RDA技术从人白血病细胞TF-1中克隆成功一个与凋亡相关的新基因TFA R19.序列分析表明,TFAR19 cDNA全长559bp,其中25-399bp编码125个氨基酸的蛋白质.mRNA斑点杂交分析表明TFAR19在50种组织中均有不同程度的表达.在大肠杆菌中表达并纯化了重组TFAR19蛋白质,制备了多克隆抗体,Western Blot发现TFAR19蛋白在凋亡的TF-1细胞中高表达.瞬时转染TFAR19正义基因后,TF-1细胞去细胞因子后凋亡速度增加.研究表明它能抑制胃癌细胞株803细胞和Hela细胞的生长,促进它们的去血清所致的凋亡.  相似文献   

19.
林丽  赵德有 《振动与冲击》2008,27(2):99-102,128
为研究在载荷作用下,结构裂纹声发射信号的变化特征,提出了将一种最近新发展起来的度量序列复杂性的统计方法--近似熵引入到结构裂纹声发射信号的研究中.介绍了近似熵的概念及性质,并对仿真声发射信号和预制裂纹钢管在静载下的声发射实验信号进行了近似熵计算分析,结果表明,近似熵在表征信号的复杂性方面有明显的效果,从而为声发射信号分析提供了一种很有效的新方法.  相似文献   

20.
蛋白质二级结构的条件隐Markov性及其预测问题   总被引:5,自引:0,他引:5  
蛋白质二级结构预测问题自1957年首次被提出迄今已有40多年了,从知道的文献中可以得出如下信息:在统计意义之下,蛋白质序列中氨基酸之间的相互作用较弱,所以,统计方法中所依赖的独立性假设虽然不是从物理背景中得来的,但的确有其合理性和方便之处;交互信息准则优于均方误差准则;信息和统计的思想和方法在预测二级结构中不可低估;加入蛋白质的一级结构之外的信息可帮助提高二级结构预测的精度;而直接从一级结构出发无附加信息的情况下预测二级结构,现存在的预测方法的预测精度仍然无较大突破;预测精度和所使用的蛋白质样本序列在总体样本中的覆盖率,是评估各种预测方法的有效性的两个重要指标。本文作者建立了一个集蛋白质一、二级结构为一体联合结构模型,并将上述信息囊括在其中。由该模型首先得到蛋白质一、二级结构的信息与统计特性,然后利用这些特性分别对蛋白质一、二级结构中各种变量的信息传递关系及隐Markov性进行定量分析和确切地统计描述。最后给出直接从一级结构出发预测二级结构的几个原则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号