共查询到20条相似文献,搜索用时 31 毫秒
1.
序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义。序列相似性算法包括基于序列比对的方法及非比对方法两种。基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异。因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量。使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合。通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性。 相似文献
2.
在Web行为挖掘中,序列模式聚类是一个很重要的课题,其首要问题就是web序列模式间的相似性度量.以往的多数方法都仅仅针对序列本身进行度量,而忽略了系统中资源本身所存在的关联关系以及用户对资源访问的时间因素.针对该问题,提出了一种基于考虑资源相似性的web访问序列模式的相似度量方法,并且考虑了用户访问资源的时间因素.经过检验,证明能够有效真实地反映实际情况. 相似文献
3.
基于蚁群算法与中心比对算法的多序列比对研究 总被引:1,自引:1,他引:0
多序列比对问题是生物信息学中一个非常重要且具挑战性的课题.为了克服以往算法应用于多序列比对时所遇到的比对序列数受限制以及比对寻优速度慢的缺点,提出一种基于蚁群算法与中心比对算法相结合的新求解算法,给出了具体的算法设计.该算法充分发挥了蚁群算法和中心比对算法的优越性,可提高求解MSA问题的计算精度和计算速度,同时较好地解决了群体的多样性和收敛深度的矛盾. 相似文献
4.
在构建进化树、比较单体型序列等生物信息学研究中,需要比对多个相似程度很高的DNA序列.对于数量多、序列长的多序列比对问题,通常使用时间复杂度较低的星比对算法.然而在处理大规模数据时,星比对的平方时间复杂度依然不能满足需要.因此,在星比对思想的基础上,本文结合关键字树理论,先找出完全匹配的区域,然后比对剩余区域,以达到降低期望时间复杂度的目的.两组实验证明了本文算法的有效性,在取得相同比对效果的情况下,本文算法运行时间小于其他方法. 相似文献
5.
介绍自动播出系统一致性比对算法的设计原理.通过分析播出系统链路间不一致的原因,分别阐述峰值信噪比、结构相似性及块均值哈希等图像比对算法原理,设计高效的内容比对方法,实现播出系统多路内容一致性自动化检测.实验测试表明该方法实时性强、鲁棒性强、准确率高. 相似文献
6.
本文针对基于内容的彩色图像相似性获取问题,提出了一种新的相似性获取方法,它既考虑了颜色内容特征,也包含了图像的空间关系特征.文章设计了无序矩阵来描述图像空间位置的相对关系,这种无序矩阵具有对旋转和平移不变性的特点.在进行图像间相似性测量时,首先用颜色直方图相交法对图像全局颜色分布进行相似性测量,再对得到的候选图像队列用新的算法进行测量,剔除不相似的图像.新的测量算法既考虑了颜色内容的匹配,同时也考虑了空间相似性的因素.用不同类型的图像对这种方法进行实验,其结果表明,它在彩色图像相似性检索时是很有效的,具有较高的检索精度.此外,它在图像发生小的旋转和平移等形变时,表现出较高的可靠性. 相似文献
7.
对于单张红外图像进行隐身效果评估,需要考虑像素点间反映的图像相似特征信息,而单一的相似性度量方法不能够全面准确地反映红外图像间相似性。在对单张红外图像均等分块的基础上,综合考虑了基于图像灰度直方图法、方向梯度直方图特征法、结构相似度法和目标分类4种相似性度量方法的优点,利用主成分分析法确定不同相似性度量方法的权重值,提出了基于综合相似性度量的评估方法。通过各相似性度量方法间横向与纵向的对比,分析不同遮挡情况下目标与背景图像间每种相似性度量方法的平均值和标准差。结果表明:综合相似性度量能够更准确地反映图像间相似性信息,更有效地处理单张红外图像隐身效果评估问题。 相似文献
8.
在生物信息学中,数据库序列比对是极为常用的操作,Smith-Waterman算法是最流行的序列比对算法,精确度高,但是计算复杂度高,在进行大量的序列比对非常耗时。另外,生物技术的发展使得已知的序列数据库变得越来越庞大,这导致进行数据库序列比对所消耗的时间也越来越长,因而有必要加速数据库序列比对算法。NVIDIA提出了CUDA编程架构,相比之前的GPGPU具有更好的可编程性,用户可以更轻松地发掘出GPU强大的计算能力。在CUDA平台上实现了Smith-Waterman的数据库序列比对算法的并行加速,速度优于已有的基于GPU的实现,超过了基于启发式算法的BLAST算法执行速度。 相似文献
9.
10.
11.
针对传统方法在分析DNA序列相似性方面的不足,提出了一种基于样本熵的DNA序列相似性分析方法.以5种东亚钳蝎神经毒素的基因序列作为分析对象,首先通过DNA序列的图形表示把DNA序列转换为时间序列,然后运用样本熵算法计算出时间序列的样本熵值,将样本熵的互值大小作为分析序列之间相似性的依据,最后将样本熵方法与DTW(Dynamic Time Warping,动态时间弯曲)方法的实验结果进行比较.实验结果表明,样本熵分析方法能有效分析序列之间的相似性,与DTW分析方法相比较,显示出更强的相似性和区别度,可将其进一步应用于生物序列的分析. 相似文献
12.
视觉导航领域已有的影像特征点匹配算法主要基于描述子的相似性度量,由于需要大量特征点且缺少对影像整体特征的考虑,影像匹配的实时性和可靠性受到影响。为此,提出一种基于聚类分析的影像特征点整体匹配算法。该算法对特征点集进行基于距离的聚类分析筛选出具有代表性且重复率较高的特征点,参考特征点分布情况将目标影像和待匹配影像剖分为4个区域,从每个区域随机选取两个特征点计算基本矩阵,基于核线约束和位置约束进行特征点的整体匹配并依据特征点间的几何相似性对匹配结果进行检核。选取慕尼黑工业大学彩色-深度数据集、无人机、移动机器人拍摄的影像进行影像匹配试验,结果表明,提出算法匹配正确率高达到97.1%,平均匹配时间小于25 ms,可以满足实时匹配的要求。 相似文献
13.
14.
15.
多序列比对是生物信息学中十分常用的序列分析方法,主要用于分析分子进化关系、基因组分析、找出DNA序列之间的共同结构特征,从而准确判断序列结构和功能之间的具体联系。现今广泛使用的多序列比对方法主要分为渐进式比对和迭代式比对两种方式,但这两种方式在进行多序列比对时的时间开销相对较大,且比对结果准确性和复杂度受限于待比对序列的质量和相似度。相对来说,星比对算法的时间复杂度更低,常用于高相似度序列之间的比对。但对低相似度序列进行比对时,其结果精度还有待提高。针对星比对算法在低相似度序列中精度较差问题,文章提出了利用偏序图生成的共识序列对星比对算法进行了优化,结合SIMD并行策略加快共识序列的产生,从而扩大了算法的应用范围,提高了比对结果准确度,该研究最后通过实验证明了算法优化的有效性。 相似文献
16.
17.
18.
大量研究表明,microRNA(miRNA)在人类复杂疾病研究中发挥着重要作用.识别miRNA与疾病之间的关系对于提高复杂疾病的治疗水平具有重要意义.然而,传统实验方式常受限于小规模和高成本,因此迫切需要计算模拟的方式快速有效地预测miRNA-疾病间的潜在关系.本文通过结合深度学习的堆叠自动编码器算法与旋转森林分类器对miRNA-疾病间关系进行预测.该方法能够有效抽取出融合了疾病语义相似性、miRNA功能相似性和miRNA序列信息的高级特征并对其进行准确分类.在交叉验证实验中,该方法在HMDD v3.0数据集上取得90.30%的预测准确率.此外,我们还在人类复杂疾病乳腺肿瘤上做了案例研究.结果,模型预测得分最高的前30个疾病关联miRNA中28个得到了证实.这些优异的结果表明,该算法是一种有效预测miRNA-疾病关系的工具,能够为生物实验提供高可靠的疾病关联miRNA候选物. 相似文献
19.