首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
多准则框架下的蛋白质三维结构相似性检索   总被引:1,自引:0,他引:1  
胡敏  彭群生  谢立广  张涛  陈为 《计算机学报》2006,29(12):2208-2217
蛋白质三维结构与功能的关系问题是当前生命科学领域的一个重大科学问题,蛋白质三维结构相似性比较则是探索蛋白质结构与功能关系的一种重要手段.文中就蛋白质结构在空间分布的特殊性提出了一种多准则框架下的蛋白质三维结构相似性检索模型.在该模型下,通过三种蛋白质空间旋转与平移不变特征的获取,实现了蛋白质骨架空间走向函数的一致性、蛋白质骨架距离直方图的一致性以及蛋白质距离矩阵数据分布一致性的多准则相似性检索策略.作者对实际的27804个蛋白质样本数据库进行实验,结果表明该文所提出的检索模式以及相似性准则的设计是实现大规模蛋白质三维结构相似性检索的一种有效方法.  相似文献   

2.
徐占  董洪伟 《计算机工程》2010,36(14):233-234
从蛋白质结构特性出发,利用结构字母表和CGR游走技术将蛋白质三维结构信息转换到二维坐标空间中。通过分析所得图像找出蛋白质分子的主体结构,获得各结构点在CGR图中的坐标,利用Hausdorff距离判定要比较的蛋白质对象相似性。该方法实现了蛋白质相似性比较的结构-序列模式转变,利用Hausdorff距离比较两点集间相似性的优势,为蛋白质相似性比较提供了一种简便有效的方法。  相似文献   

3.
为了对蛋白质的三维结构进行比较研究,提出了一种利用分形理论对蛋白质空间复杂度进行评价的方法.采用原子覆盖蛋白质α碳骨架,进行蛋白质三维结构的分维计算,并与互联网上提供蛋白质比较的网站所对应的数据相比较,结果表明,本方法有效快速,可对蛋白质结构进行粗分类.  相似文献   

4.
为了指导新药探索,减少耗费过高的实验次数,需要有一个准确、快速的分子相似性判定方法来选择待比较的分子.为此提出一种蛋白质结构相似性比较方法,使用空间球极坐标3个分量划分蛋白质所在区域,得到蛋白质基本组成元素的空间密度特征,进而判定2个蛋白质结构的相似性.实验结果表明,该方法可作为各种结构蛋白质相似性比较的辅助手段,不仅能较好地反映蛋白质分子的空间结构特征,而且还有令人满意的时间复杂性,对大分子的相似性比较及进一步分类将有重要意义.  相似文献   

5.
片段组装方法是从头预测蛋白质三维结构的一类重要方法.现有的基于序列相似的片段库质量限制了低同源目标的预测精度,所以寻找与天然结构更加拟合的已知蛋白质结构片段来构建高质量的片段库是片段组装方法的一项重要任务.本文利用SCOP数据库中的三维结构相似性,对SCOP的折叠模式进行预测,提取预测出的相同折叠模式的已知蛋白质结构的信息,生成保存残基信息的数据库(Vall库).然后将目标蛋白质序列分割成的残基片段与Vall库进行综合评价后生成一种新的片段库,该片段库可以用于一个骨架预测并行蚁群算法.将本文方法与蛋白质结构预测程序RosettaAbinitio的基于序列的片段库进行了比较,实验结果表明采用本文方法的片段库可以找到更接近天然构象的蛋白质结构.  相似文献   

6.
蛋白质三维结构决定了其特殊的生物功能,蛋白质三维结构对蛋白质功能研究、疾病的诊断与治疗、创新药物研发都有着重要的科学意义。利用计算机技术从氨基酸序列预测蛋白质三维结构是获取蛋白质三维结构的有效方法。片段组装是一种广泛采用的蛋白质结构预测技术,它将连续的构象空间优化问题转换成离散的实验片段组合优化问题,从而有效地减小了构象搜索空间。首先介绍了片段组装技术;其次总结了基于片段组装的蛋白质结构预测的发展历程,并对部分具有代表性的方法进行了简要阐述;然后介绍了蛋白质结构预测研究中常用的数据库和评价指标,并比较了不同预测方法的性能;最后分析并指出了当前基于片段组装的蛋白质结构预测方法所存在的挑战性问题,并对该领域未来的研究方向进行了展望。  相似文献   

7.
生物信息学的一个关键的研究课题是理解细胞的分子机制,这依赖于对基因所决定的每一条蛋白质的含义或者功能的理解.一般通过与一条或多条功能已知的蛋白质的相似性比较来推测未知蛋白质的功能,其中,基于支持向量机的一些算法取得了很好的成果.SVM-pairwise算法是当前最好的基于支持向量机的算法中的一个,该方法利用两条序列的相似性来将蛋白质序列转化为固定长度的向量.文中提出了一种新的利用支持向量机算法对蛋白质序列进行分类的方法,这种方法使用位点进化距离代替两条序列的比对得分,该方法比SVM-pairwise有着显著的改善,在蛋白质结构分类数据库(SCOP)上进行的实验表明,该方法具有比SVM-pairwise更好的分类性能.  相似文献   

8.
为了解生物学上蛋白质的空间构成情况,通过对生物学上蛋白质实际空间组成结构的分析,本文提出了一种抽象的蛋白质三维结构连续数学模型与之对应,应用拟物的方法找到了对应于此数学模型的物理模型,并且用数学方法客观、精准地对该模型进行了公式表达,然后应用数学求最值的方法且结合一种优化算法对以上公式进行了有效的演算,并得到了比较好的结果。因此,我们就找到了相应的一种求解蛋白质三维构型的高效算法,应用该算法能更快更优地得到相应蛋白质链的近似最优构型。  相似文献   

9.
氨基酸序列编码问题一直是在蛋白质结构预测中导致算法输入空间较大的主要原因。只有对氨基酸序列进行更好的编码.才能为后续进行计算机分析打下基础。提出并实现了综合考虑了氨基酸序列的划分和长程作用效应,利用氨基酸正交编码区分每个氨基酸个体,利用基本正交矩阵获得氨基酸在物理、化学、生物上的相似性,利用分属概率来获得当前蛋白质序列中氨基酸构成不同二级结构的趋势的新的混合编码方法,从而改进了氨基酸残基序列编码,并利用现有算法比较了不同编码方式对蛋白质二级结构预测的影响,结果证实该编码方式能够提高蛋白质二级结构预测的准确性。  相似文献   

10.
氨基酸序列编码问题一直是在蛋白质结构预测中导致算法输入空间较大的主要原因。只有对氨基酸序列进行更好的编码,才能为后续进行计算机分析打下基础。提出并实现了综合考虑了氨基酸序列的划分和长程作用效应,利用氨基酸正交编码区分每个氨基酸个体,利用基本正交矩阵获得氨基酸在物理、化学、生物上的相似性,利用分属概率来获得当前蛋白质序列中氨基酸构成不同二级结构的趋势的新的混合编码方法,从而改进了氨基酸残基序列编码,并利用现有算法比较了不同编码方式对蛋白质二级结构预测的影响,结果证实该编码方式能够提高蛋白质二级结构预测的准确性。  相似文献   

11.
Over the past several decades, biologists have conducted numerous studies examining both general and specific functions of proteins. Generally, if similarities in either the structure or sequence of amino acids exist for two proteins, then a common biological function is expected. Protein function is determined primarily based on the structure rather than the sequence of amino acids. The algorithm for protein structure alignment is an essential tool for the research. The quality of the algorithm depends on the quality of the similarity measure that is used, and the similarity measure is an objective function used to determine the best alignment. However, none of existing similarity measures became golden standard because of their individual strength and weakness. They require excessive filtering to find a single alignment. In this paper, we introduce a new strategy that finds not a single alignment, but multiple alignments with di?erent lengths. This method has obvious benefits of high quality alignment. However, this novel method leads to a new problem that the running time for this method is considerably longer than that for methods that find only a single alignment. To address this problem, we propose algorithms that can locate a common region (CORE) of multiple alignment candidates, and can then extend the CORE into multiple alignments. Because the CORE can be defined from a final alignment, we introduce CORE* that is similar to CORE and propose an algorithm to identify the CORE*. By adopting CORE* and dynamic programming, our proposed method produces multiple alignments of various lengths with higher accuracy than previous methods. In the experiments, the alignments identified by our algorithm are longer than those obtained by TM-align by 17% and 15.48%, on average, when the comparison is conducted at the level of super-family and fold, respectively.  相似文献   

12.
排比句具有结构紧凑、句式整齐、富有表现力等鲜明的特点,广泛应用在各种文体之中,在近几年语文高考的鉴赏类问题中也多有考察,但在自动识别方面的研究还鲜有涉及。该文依据排比句结构相似、内容相关的特点,以句子的词性、词语作为基本特征,设计了融合卷积神经网络和结构相似度计算的排比句识别方法。首先将词向量和词性向量融入句子的分布式表示中,利用多个卷积核对其进行卷积操作,设计出基于卷积神经网络的排比句识别方法。利用分句之间的词性串构造相似度计算,设计了基于结构相似度计算的排比句识别方法。同时考虑句子内部的语义相关性和结构相似性,将卷积神经网络和结构相似度计算方法融合,用于排比句的识别。对文学作品数据集和高考题中的文学类阅读材料数据集进行排比句识别实验,验证了该文所提的方法是有效的。  相似文献   

13.
蛋白质的生物功能是由它们的空间折叠结构决定的,理解蛋白质的折叠过程是生物信息学领域中极具挑战性的问题之一。近年来,各种优化方法用于蛋白质空间折叠结构预测。这些方法仍存在着不足,算法在变量数目增大时,难以收敛到全局最优解,并容易产生早熟收敛,从而影响求解精度和效率。针对蛋白质结构预测模型多变量多极值的特点,文章采用机器学习方法对蛋白质进行折叠结构预测。  相似文献   

14.
We show that visio-spatial representations and reasoning can be used as a similarity metric for case-based protein structure prediction. Our system retrieves pairs of α-helices based on contact map similarity, then transfers and adapts the structure information to an unknown helix pair. We show that similar protein contact maps predict a similar three-dimensional protein structure. The success of this method provides support for the notion that changing representations can enable similarity metrics in case-based reasoning.  相似文献   

15.
图像分类是计算机视觉的重要研究领域, 选择一种特征建立图像间的相似性度量是图像分类的关键问题。鉴于壁画图像自身的特点,轮廓特征是能够表达壁画图像语义的重要特征。很多研究已经表明轮廓可以作为图像的重要特征进行图像的识别和分类,但以往研究往往都通过两两最相似轮廓间的chamfer距离来计算图像间的相似 性, 或者对轮廓建立局部描述符, 聚类生成词典, 用统计直方图的方式描述图像特征, 然后用SVM进行图像分类。 这些方法都忽略了轮廓间的整体结构关系,缺乏对所有轮廓的整体性描述,而现实中一幅图像的语义更多的是一种整体上的语义。本文研究基于轮廓整体结构的图像间相似性度量方法,图像间轮廓的相似度计算要受到与其它轮廓空间结构关系的约束,由此生成的相似度更能够表达两幅图像的整体相似程度。实验结果表明我们的方法在壁画图像的分类上相对于没有整体结构约束的方法有了精度上的提高.  相似文献   

16.
图像分类是计算机视觉的重要研究领域,选择一种特征建立图像间的相似性度量是图像分类的关键问题.鉴于壁画图像自身的特点,轮廓特征是能够表达壁画图像语义的重要特征.研究表明轮廓可以作为图像的重要特征进行图像的识别和分类,但以往研究往往是通过两两最相似轮廓间的chamfer距离来计算图像间的相似性,或者对轮廓建立局部描述符,聚类生成词典,用统计直方图的方式描述图像特征,然后用支持向量机(SVM)进行图像分类.这些方法都忽略了轮廓间的整体结构关系,缺乏对所有轮廓的整体性描述,而现实中一幅图像的语义更多的是一种整体上的语义.基于轮廓整体结构的图像间相似性度量方法,图像间轮廓的相似度计算要受到与其他轮廓空间结构关系的约束,由此生成的相似度更能够表达两幅图像的整体相似程度.实验结果表明本文方法在壁画图像的分类上相对于没有整体结构约束的方法精度有所提高.  相似文献   

17.
基于模糊商空间的聚类分析方法   总被引:1,自引:0,他引:1  
唐旭清  朱平  程家兴 《软件学报》2008,19(4):861-868
在商空间理论基础上,提出了基于Fuzzy相似关系和归一化距离的聚类分析方法,用以解决复杂系统的数据结构分析问题.得到了如下结论:(1)通过引入基于Fuzzy相似关系和归一化距离的分层递阶结构,建立了严格的聚类分析理论描述;(2)给出了有效的分层递阶结构聚类的快速算法;(3)给出了两个Fuzzy相似关系或由两个归一化距离诱导的Fuzzy相似关系是同构的充分条件.其中所研究的理论和方法适应于建立在相似关系之上的任何复杂系统的数据结构分析.  相似文献   

18.
有效分析蛋白质家族是生物信息学的一项重要挑战,聚类成为解决这一问题的主要途径之一.基于传统序列比对方法定义蛋白质序列间相似关系时,假设了同源片断问的邻接保守性,与遗传重组相冲突.为更好地识别蛋白质家族,提出了一种蛋白质序列家族挖掘算法ProFaM.ProFaM首先采用前缀投影策略挖掘表征蛋白质序列的模式,然后基于模式及其权重信息构造相似度度量函数,并采用共享最近邻方法,实现了蛋白质序列家族聚类.解决了以往方法在蛋白质模式挖掘及相似度设计中的不足.在蛋白质家族数据库Pfam上的实验结果证实了ProFaM算法在蛋白质家族分析上有良好的结果.  相似文献   

19.
提出了一种基于TreeMiner算法挖掘频繁子树的文档结构相似度量方法,解决了传统的距离编辑法计算代价高而路径匹配法无法处理重复标签的问题。该方法架构了一个新的检索模型—频繁结构向量模型,给出了文档的结构向量表示和权重函数,构造了XML文档结构相似度量计算公式;同时从数据结构和挖掘程序上对TreeMiner 算法进行了改进,使其更适合大文档数据集的结构挖掘。实验结果表明,该方法具有很高的计算精度和准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号