首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
在系统发育分析等分子生物学的研究问题中,传统上要用到基于多序列比对的方法,然而这类方法有一定的局限性。本文介绍了一类新的研究系统发育问题的方法——非比对方法,该类方法可以克服基于比对距离方法在计算规模和主观因素等方面的局限性以及由基因重组导致的比对失效。同时,本文选取新方法中的几种分子序列相似度度量,用于94种哺乳动物的线粒体全基因组序列的系统发育分析研究中。由比较结果看来,非比对方法中的FDOD度量得到的结果与传统的分类学结果最为一致;并进一步和由基于比对的距离方法对哺乳动物细胞色素b的系统发育分析得到的结果作比较,发现FDOD不仅不逊色于传统的基于比对的距离方法,而且在对哺乳动物纲各个目的整合能力上普遍优于传统方法。  相似文献   

2.
利用三联体和单联核苷酸的联合概率分布的差异来表示序列之间的差异,提出了一种新的关联特征TBC;对TBC特征矩阵进行平移极差变换,利用指数切比雪夫距离法构建了模糊相似矩阵,采用模糊聚类中的传递闭包法构建进化树。该方法不需要多序列比对,计算简单。对两组基因组序列构建进化树,实验结果验证了该方法的有效性。  相似文献   

3.
贾楠  付晓东  黄袁  刘晓燕  代志华 《计算机应用》2012,32(12):3529-3533
在工作流的发现和聚类等应用中,需要对两个工作流模型的距离进行度量。因此,提出一种计算两个不同结构化工作流的距离定量度量方法。首先介绍了结构化工作流,并将每一个结构化工作流转换为流程结构树;然后基于两个结构树之间的树编辑距离来计算工作流之间的距离及相应相似度。该距离度量方法满足距离度量的3个属性,即同实体不可区分性、对称性和三角不等式性质。这些属性使得该距离度量方法可以在工作流模型管理活动中作为定量分析工具。实验结果表明,基于树编辑距离的工作流度量方法是可行的。同时,与基于邻接矩阵的距离度量方法相比,该方法考虑了不同结构之间的语义距离,有效验证了此方法的合理性。  相似文献   

4.
在介绍生物信息学中多序列比对定义和原理的基础上,给出了序列结构信息集的表示形式和基于序列结构信息的度量函数,该函数只与参加比对序列自身信息有关,不受主观因素的影响,能更客观、有效地反映生物序列之间的进化距离.通过利用该函数计算序列间的进化距离,在渐进比对的基础上,采用迭代策略,不断修正指导树,进而提高比对的准确性,避免了局部最优问题.最后,通过实验模拟,本算法在保证不提高计算时间复杂度的基础上,提高了序列比对的准确性,同时也很好地反映了生物学意义.  相似文献   

5.
陈勃  季平 《计算机应用研究》2012,29(8):2956-2960
针对生物信息学领域中种系发生树构建这一重要课题的需要,利用DNA碱基序列的频度混沌游走表示法,提出一种碱基序列自重复性的度量和一种序列间相关性的度量,并由此出发,提出了一种新的以此种相关性为依据的聚类方法。利用这样的方法,通过GenBank中获取的线粒体DNA数据构建了一棵包含20个物种的种系发生树。实验结果验证了新提出的度量方法以及聚类方法在种系发生树构建问题上的有效性。此外,由于这种方法使用碱基序列的图形表示法,而非传统的串形表示法,避免了建树过程中序列间联配的步骤。  相似文献   

6.
序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义.序列相似性算法包括基于序列比对的方法及非比对方法两种.基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异.因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量.使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合.通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性.  相似文献   

7.
魏国强  周从华  张婷 《计算机与数字工程》2021,49(11):2299-2304,2406
针对常用方法无法准确度量多元时间序列相似程度的问题,提出一种基于多维分段和动态权重动态时间弯曲距离的多元时间序列相似性度量方法.首先对多元时间序列进行多维分段拟合,选取拟合段的斜率、均值和时间跨度作为每一段的特征,在对多元时间序列降维的同时也保留了变量之间的相关性;然后提出一种动态权重动态时间弯曲距离度量方法计算多元时间序列特征矩阵之间的距离,避免了直接使用动态时间弯曲距离造成的畸形匹配问题.最终实验结果也验证了该方法在多种类型的数据集上都能取得较高的度量精度,表明了该方法的有效性.  相似文献   

8.
一种基于模糊聚类的构造进化树方法   总被引:1,自引:0,他引:1  
各种生物之间的进化史可以通过构建进化树来讨论,因此进化树的研究成了一个研究热点。提出将利用DNA序列的4D表示所得相似矩阵视为模糊矩阵,再利用最大树法来构建进化树的方法。该方法不需要多序列比对,计算简单,实验验证了该方法的有效性。  相似文献   

9.
高亮  孙卫 《计算机应用研究》2012,29(9):3255-3258
针对不确定信息的相似性度量方法无法充分反映信息之间的关联情况,提出了直觉模糊集关联趋势分析法(RTIFS法)。利用直觉模糊集之间的距离表示不确定信息的差别,通过区间数与直觉模糊集之间的等价关系,利用区间数的距离计算直觉模糊集的关联度,最后应用集对分析法对序列间的关联趋势进行分类。RTIFS法将关联度计算的范围推广到不确定信息环境下,并给出多特征序列关联趋势的分类结果。实验结果表明,RTIFS法的分类准确率较高,算法运行时间短。  相似文献   

10.
针对动态时间弯曲方法计算时间过长的问题,提出增量动态时间弯曲来度量较长时间序列之间的相似性。首先利用动态时间弯曲方法对历史时间序列数据进行相似性度量,得到相应的历史最优弯曲路径和路径中各元素的累积距离代价。其次,通过逆向弯曲度量方法完成当前序列数据 的相似性度量,结合历史数据信息找到与历史弯曲路径相交且度量时间序列距离为当前最小值的新路径,进而实现增量动态时间弯曲的相似性度量。该方法不仅具有良好的度量质量,还具有较高的时间效率。数值实验表明,对于大部分时间序列数据集,新方法的分类准确率和计算性能要优于经典动态时间弯曲。  相似文献   

11.
由经典一维混沌映射构造密码系统存在短周期轨道、密钥空间小和相空间分布不均匀等安全性缺陷.为解决经典一维混沌密码的安全性问题,提出了一种新型的一维单峰混沌系统及其改进的复合形式.采用普适性均匀化算法来获得等概率分布的混沌序列并给出了概率密度数学证明.对改进的单峰混沌系统的遍历性、李雅普诺夫指数、相空间和分岔、信息熵和近似熵等动力学和随机特性指标进行了计算和分析.通过与相关研究的对比可知,改进的单峰混沌系统具有稳定的李雅普诺夫指数、扩展的相空间、均匀的概率密度和更高的近似熵值.理论推导和数值计算论证了本方案可以满足密码系统中非线性部件的安全属性要求.  相似文献   

12.
由于多电飞机拓扑结构复杂且发生故障的概率较低,采用传统的蒙特卡罗采样方法进行可靠度评估时存在采样次数多,仿真时间长等缺点。通过信息熵引入多元件系统的近似概率分布,从而提出一种适用于多电飞机供电可靠度评估方法,在信息熵中引入最优参数,改变了元件的故障概率分布,构造了元件零方差概率密度函数的近似函数,然后利用差分进化求解最优参数。结合对偶抽样的信息熵法可进一步降低采样过程的方差,提高了传统蒙特卡罗方法的采样效率。最后使用一个多电飞机电源系统为应用案例,对几种可靠度分析方法进行收敛性和准确性分析,其结果表明本文方法在小概率事件评估问题上优势明显。  相似文献   

13.
The importance of predictors is characterized by the extent to which their use reduces uncertainty about predicting the response variable, namely their information importance. The uncertainty associated with a probability distribution is a concave function of the density such that its global maximum is a uniform distribution reflecting the most difficult prediction situation. Shannon entropy is used to operationalize the concept. For nonstochastic predictors, maximum entropy characterization of probability distributions provides measures of information importance. For stochastic predictors, the expected entropy difference gives measures of information importance, which are invariant under one-to-one transformations of the variables. Applications to various data types lead to familiar statistical quantities for various models, yet with the unified interpretation of uncertainty reduction. Bayesian inference procedures for the importance and relative importance of predictors are developed. Three examples show applications to normal regression, contingency table, and logit analyses.  相似文献   

14.
中文拼写纠错是一项检测和纠正文本中拼写错误的任务。大多数中文拼写错误是在语义、读音或字形上相似的字符被误用,因此常见的做法是对不同模态提取特征进行建模。但将不同特征直接融合或是利用固定权重进行求和,使得不同模态信息之间的重要性关系被忽略以及模型在识别错误时会出现偏差,阻止了模型以有效的方式学习。为此,提出了一种新的模型以改善这个问题,称为基于文本序列错误概率和中文拼写错误概率融合的汉语纠错算法。该方法使用文本序列错误概率作为动态权重、中文常见拼写错误概率作为固定权重,对语义、读音和字形信息进行了高效融合。模型能够合理控制不同模态信息流入混合模态表示,更加针对错误发生处进行学习。在SIGHAN基准上进行的实验表明,所提模型的各项评估分数在不同数据集上均有提升,这验证了该算法的可行性。  相似文献   

15.
基于双向语义的中文实体关系联合抽取方法   总被引:1,自引:0,他引:1  
禹克强  黄芳  吴琪  欧阳洋 《计算机工程》2023,49(1):92-99+112
现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响。提出一种基于双向语义的中文实体关系联合抽取方法。利用RoBERTa预训练模型获取具有上下文信息的文本字向量表征,通过首尾指针标注识别句子中可能存在关系的实体。为了同时利用文本中的双向关系语义信息,将实体分别作为关系中的主体与客体来建立正负关系,并利用两组全连接神经网络构建正负关系映射器,从而对每一个输入实体同时从正关系与负关系的角度构建候选关系三元组。将候选关系三元组分别在正负关系下的概率分布序列与实体位置嵌入特征相结合,以对候选三元组进行判别,从而确定最终的关系三元组。在DuIE数据集上进行对比实验,结果表明,该方法的精确率与召回率优于MultiR、CoType等基线模型,其F1值达到0.805,相较基线模型平均提高了12.8%。  相似文献   

16.
Probability distributions are extensively utilized in many areas of Computer Science such as Machine Learning, Information Retrieval and Databases. The computation of a probability distribution can be a difficult task because of the exponential size of the event space. As a consequence, researchers investigated methods for approximating probability distributions. This article provides a brief survey of the key research contributions to the design and the implementation of probability approximation methods. The article allows the reader to rapidly obtain relevant information which can effectively be utilized in research work.  相似文献   

17.
This article describes a separability measure for class discrimination. This measure is based on the Fisher information measure for estimating the mixing proportion of two classes. The Fisher information measure not only provides a means to assess quantitatively the information content in the features for separating classes, but also gives the lower bound for the variance of any unbiased estimate of the mixing proportion based on observations of the features. Unlike most commonly used separability measures, this measure is not dependent on the form of the probability distribution of the features and does not imply a specific estimation procedure. This is important because the probability distribution function that describes the data for a given class does not have simple analytic forms, such as a Gaussian. Results of applying this measure to compare the information content provided by three LANDSAT-derived feature vectors for the purpose of separating small grains from other crops are presented.  相似文献   

18.
针对非约束环境下的人脸特征定位问题,在概率框架下提出一种基于小样本的精确定位策略。通过对比分析,提取人脸主要特征的颜色和灰度信息及人脸特征之间的几何约束信息,利用混合高斯模型分别对其进行概率建模。之后建立定位融合策略,不仅考虑每种人脸特征的概率分布,还考虑其周围元素的概率分布特性,及各元素之间的几何约束。实验结果表明,该方法能在少量训练样本图像且样本个体较为单一的条件下,实现人脸主要特征的精确定位,且定位精度高于现有方法。  相似文献   

19.
The Dempster-Shafer evidence theory is widely used in many fields of information fusion because of its advantage in handling uncertain information. One of the key issues in this theory is how to make decision based on a basic probability assignment (BPA). Currently, a feasible scheme is transforming a BPA to a distribution of probabilities. However, little attention was paid to the correlation between BPA and probability distribution. In this paper, a novel method about the probability transformation based on a correlation coefficient of belief functions is proposed. The correlation coefficient is a new measurement, which can effectively measure the correlation between BPAs. The proposed method aims at maximizing the correlation coefficient between the given BPA and the transformed probability distribution. On the basis of this idea, the corresponding probability distribution can be obtained and could reflect the original information of the given BPA to the maximum extent. It is valid to consider that the proposed probability transformation method is reasonable and effective. Numerical examples are given to show the effectiveness of the proposed method.  相似文献   

20.
崔铁军    李莎莎 《智能系统学报》2020,15(1):136-143
为了在获得少故障数据条件下得到适合的系统故障演化过程(system fault evolution process,SFEP)中最终事件发生概率分布,提出一种考虑信息扩散且数据较少情况下的最终事件发生概率分布计算方法。该方法利用信息扩散原理以事件发生时因素为中心在研究区域内形成正态分布。同一事件的多次发生在研究区域中取最大值形成该事件发生概率分布,从而得到SFEP中边缘事件发生概率分布。将SFN中事件关系表示为关系组从而叠加关系,得到最终事件发生概率分布解析式计算分布。研究表明,所得结果与原有精确结果具有较高的符合性,但所需故障数据则少得多。可借助该方法在少故障数据条件下研究SFEP最终事件发生特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号