首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
本文提出了蛋白质的一种二维数字表达,该表达考虑了组成蛋白质的核苷酸在DNA双螺旋结构中的对称性和密码子当中的核苷酸组成规律,使之与生物学意义相符合。Cosic’s 的一维共鸣识别方法是一种数学物理模型,它使用信号处理的方法识别蛋白质序列当中包含的信息。根据本文提出的蛋白质二维数字表达,并结合使用向量序列的傅里叶变换理论,提出了高维共鸣识别方法。结果显示,本文提出的二维数字表达和高维共鸣识别在判别双序列的蛋白质相似性问题时也是有效的。  相似文献   

2.
基于事件的时间序列相似性度量方法   总被引:2,自引:0,他引:2  
吴学雁  黄道平 《计算机应用》2010,30(7):1944-1946
为了在时间序列相似性度量过程中更好地体现用户的需求,提高相似性度量的准确度,提出了基于事件的时间序列相似性度量方法(SMBE)。首先将用户的需求定义为事件,将原始时间序列转化为事件序列;然后,构建了基于事件序列的相似性度量模型(SMBE),SMBE定义了不同事件序列中各元素之间的相似性,并构成相应的相似性矩阵,对相似性矩阵进行搜索得到最优路径的值作为序列之间的相似性度量;最后,提出了基于SMBE的聚类方法。实验表明,在参数设置合理的情况下,能获得接近0.90的聚类精度。  相似文献   

3.
针对目前协同过滤推荐算法中数据稀疏和语义信息欠缺问题,提出一种融合知识图谱表示学习的栈式自编码器推荐算法(SAEKG-CF)。将评分矩阵作为栈式自编码器的输入,训练得到项目的隐性特征向量,并据此计算特征相似性矩阵;利用知识图谱表示学习算法将项目中的实体映射到低维向量空间,并计算出低维向量空间中实体间的语义相似性矩阵;将特征相似性矩阵与语义相似性矩阵相融合,得到融合相似性矩阵,进而依据最优融合相似性矩阵产生top-k推荐列表。实验结果表明,该算法能有效地同时解决数据稀疏与语义信息欠缺问题,提高推荐的准确率。  相似文献   

4.
针对当前DNA序列图形表达模式中存在简并现象的相关问题,提出了一种新的二元符号图形表达方式。将四类碱基的编码过程看成是构成DNA序列的元素在直角坐标平面上的移动过程,以两种不同的标志符号来解决可能出现的元素重叠情况。此方案所标志的图形不存在自交现象,从而在DNA序列和图形表达之间建立了一一对应的关系。通过实例说明该方法在对无向图和有向图表达中均能有效地降低图形简并度,并引入人工代谢系统中的编码模式作为分析工具对DNA序列进行比较分析;以代谢中间物值作为参数,研究不同物种的DNA序列之间的相似性。实例分析表明,该参数能较好地表征不同物种之间的相似性程度高低,是一种简便可行的DNA序列特征的比较方法。  相似文献   

5.
基于隐马尔科夫模型的DNA序列分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
DNA序列分类是生物信息学的一项基础任务,目的是根据结构或功能的相似性预测DNA序列所属的类别。为进行有效分类,如何将序列映射到特征向量空间并最大程度地保留序列中蕴含的碱基间顺序关系是一项困难的任务。为克服现有方法容易导致因DNA序列碱基残缺而影响分类精度等问题,提出一种新的DNA序列特征表示方法。新方法首先为每条序列训练一个隐马尔科夫模型(HMM),然后将DNA序列投影到由HMM状态转移概率矩阵的特征向量构成的向量空间中。基于这种新的特征表示法,构造了一种 K-NN分类器对DNA序列进行分类。实验结果表明,新型特征表示方法可以较为完整地保留 DNA 序列中不同碱基间的关系,充分反映序列的结构信息,从而有效提高了序列的分类精度。  相似文献   

6.
针对传统方法在分析DNA序列相似性方面的不足, 提出了一种新的基于信息量的DNA序列相似性分析算法, 该方法将DNA序列视为基于符号集{A, C, G, T}的信号序列, 全部待比较的DNA序列组合成一个以字符A、C、G、T为属性值的信息系统。在所得数据库系统中引进DNA序列的信息量、联合信息量、条件信息量、交互信息量等概念, 讨论这些信息量的性质并给出它们之间的一些关系式, 然后在此基础上构建DNA序列相似性分析模型。仿真实验结果表明, 该方法不但能快速、有效地分析DNA序列相似性, 而且较好地克服了DNA碱基数量很大且不同物种的DNA序列长短不同的不足。  相似文献   

7.
基因序列图形表达及聚类分析应用研究   总被引:2,自引:0,他引:2  
周迎春  骆嘉伟  杨莉 《计算机应用》2007,27(9):2330-2333
在基因序列图形表达模型研究的基础上,提出了一种新的非退化的基因图形三维表示方法。该表达方法不仅避免了图形的重叠和交叉,同时还保留了序列的生物学特征。利用该表达方法对H5N1病毒基因序列进行数字特征的提取并引入基于多维PFS判别函数进行模糊聚类分析应用。在聚类分析过程中直接利用数字特征矩阵作为分析数据,分析结果表明:利用文中所给图形表达建立基因序列数字特征矩阵进行的聚类分析具有一定的合理性。  相似文献   

8.
在提出的符号序列的高维数字表达以及高维傅里叶变换概念的基础上,提出了蛋白质比较的新方法——高维共鸣识别。将两种蛋白质对应的氨基酸序列转化为向量序列,分别计算它们对应的向量序列的离散傅里叶变换。据此,定义两个蛋白质序列所对应的交叉谱函数,考查交叉谱函数的信噪比,判断两种蛋白质序列的相似性或差异性。计算结果显示它是蛋白质比对的又一个有效方法,是Cosic一维共鸣识别的拓展。  相似文献   

9.
序列相似性分析是生物信息学中一个重要问题,对于研究物种的进化起源有着重要的意义.序列相似性算法包括基于序列比对的方法及非比对方法两种.基于比对的方法对于序列整体的衡量略有欠缺;非比对算法中有DNA曲线化方法以及比较序列各自整体碱基分布间的信息量差异的方法,只是考虑了序列整体信息间的差异,但未考虑序列各个位点间的差异.因此,提出了一种基于信息熵的相似性度量模型,把序列比对与信息量差异结合起来,将两条比对后的序列间的平均交互信息量与其联合熵之比作为两条序列的相似性度量.使用该度量构建了11个物种的相似性矩阵,对各物种间的相似性进行了分析,结果在一定程度上与生物分类学相契合.通过距离矩阵所构建的进化树,也反映了各物种间的进化关系,表明该模型的设计具有合理性.  相似文献   

10.
基于蛋白质CGR的线粒体蛋白质序列比对   总被引:1,自引:0,他引:1  
利用蛋白质混沌游走表示法(PCGR)提出一种新的蛋白质序列比对方法。通过计算两序列之间的PCGR点距离,就可以找到所有的局部相似片断。根据氨基酸的化学物理性质把氨基酸分成4和7类,针对分类与无分类的各种情况进行蛋白质序列比对。为了更直观地描述比对结果,采用点阵图来表示比对数据,不仅能显示两序列间所有相同片断,还可以体现出序列的相似性。  相似文献   

11.
低秩表示(Low-Rank Representation,LRR)在探索数据中的低维子空间结构方面具有良好的效果,近年来引起了人们的广泛关注。然而,传统的LRR方法通常使用欧氏距离来度量样本的相似性,仅考虑相邻样本两两之间的距离信息,对于具有流形结构的数据往往不能反映其固有的几何结构。最近的研究表明,概率激励距离测量(即有效距离)可以有效地对数据的全局信息进行建模,来度量样本间的相似性。在此基础上,提出了一种基于有效距离的低秩表示模型。该方法用稀疏表示方法计算样本之间的有效距离来构造拉普拉斯矩阵,并将其进行低秩表示拉普拉斯正则化约束,该模型不仅能表示全局低维结构,而且能捕获流形结构数据中的几何结构信息。为了评估方法的有效性,在三个公开数据集上进行了分类实验。实验结果表明,该方法比基于传统欧氏距离的方法,具有更高的分类性能和更强的鲁棒性。  相似文献   

12.
提出了一种基于多特征字典的稀疏表示算法。该算法针对SRC的单特征鉴别性较弱这一不足,对样本提出多个不同特征并分别进行相应的稀疏表示。并根据SRC算法计算各个特征的鉴别性,自适应地学习出稀疏权重并进行线性加权,从而提高分类的性能。实验表明,基于自适应权重的多重稀疏表示分类算法,具有更好的分类效果。  相似文献   

13.
针对非对称局部二值模式(AR-LBP)提取的人脸特征有限,以及协同表示分类(CRC)人脸存在的类间干扰,提出以多层AR-LBP特征及联合韦伯局部描述子(WLD)特征进行补充,并以增加CRC中稀疏性来降低类间干扰。提取人脸图像的多层AR-LBP特征并级联,与从原图像提取的WLD特征级联得到多层AR-LBP与WLD融合特征,采用稀疏增强的协同表示分类(SA-CRC)完成人脸分类。在ORL、Yale和GT公开人脸库上,提出的多层AR-LBP与WLD特征融合算法与AR-LBP特征提取算法、WLD特征提取算法以及多层LBP与HOG特征融合算法相比,识别正确率提高了0.7%~42.6%;当利用SA-CRC取代CRC后,识别正确率进一步得到提高。  相似文献   

14.
杨宏雨  余磊  王森 《计算机工程》2011,37(24):147-149
为降低Gabor特征的维数,提出一种基于Gabor相位的纹理表征(GPTR)方法,将其应用于人脸识别。GPTR采用广义高斯分布 (GGD)拟合Gabor相位的分布,将拟合的GGD参数作为纹理特征。采用保局投影方法对纹理特征向量进行子空间分析,进一步降低其维数并增强鉴别力。在FERET及Yale人脸库上的实验结果表明,相比传统的Gabor幅值特征,GPTR具有更高的人脸识别准确率。  相似文献   

15.
当传统时空金字塔层数较多时,特征描述符的维数会非常高,使得此类描述符在训练和测试阶段计算效率非常低。此外,在时空金字塔的分层及每层立方体单元的划分中,至今仍然采用手动划分视频,使得视频划分策略没有强的理论依据。鉴于以上缺点,提出一种高显著性的时空金字塔精简描述符算法。形成的新描述符是所有时空金字塔层中每个立方体单元局部特征的权重和,而不是把所有立方体单元局部特征描述符串联起来形成一个巨大的特征描述符,每个立方体单元的权重可以通过偏最小二乘法自动获取,由此产生的视频全局描述符精简并且具有高的显著性。此外通过观测其精细立方体单元的权重,还可以展现出显著性时空金字塔每个立方体单元及每层金字塔的贡献,由此,可以根据权重自动划分视频。采用HMDB51和YouTube两个动作数据库进行实验验证,与时空金字塔描述符和超稀疏编码向量相比,此描述符精简并能在低维度下取得较好的识别效果。  相似文献   

16.
编码问题是遗传算法研究的难点。浮点数编码在函数和约束优化中明显优于其他编码,并能提高算法的局部搜索能力。浮点数编码在遗传环境中产生的噪音和对算法性能的影响,正在被研究者所关注。但目前尚无基于多小波阈值实现浮点数编码消噪变异的研究成果出现。首先研究了多小波和浮点数编码噪音的性质,提出了一种基于多小波阈值的浮点数编码消噪变异方法,并与其他算法进行比较实验。研究和实验结果表明,这种方法可明显提高算法的收敛精度和速度,改善算法的整体性能。  相似文献   

17.
工程勘察岩土信息服务系统是和地理位置密切相关的典型LBS应用,针对其要求适应多种的移动终端和岩土数据图形表示复杂的特点,重点研究了SVG技术的特点、移动定位计算方法和岩土信息可化表示方法,提出了适合岩土信息服务的简化计算方法的SVG定位模型和SVG岩土信息分层可视化描述模型,实现了通过手机等移动客户端进行工程勘察数据的远程原位置查询、地层图形显示验证的应用服务。  相似文献   

18.
DNA sequence comparison by a novel probabilistic method   总被引:1,自引:0,他引:1  
This paper proposes a novel method for comparing DNA sequences. By using a graphical representation, we are able to construct the probability distributions of DNA sequences. These probability distributions can then be used to make similarity studies by using the symmetrised Kullback-Leibler divergence. After presenting our method, we test it using six DNA sequences taken from the threonine operons of Escherichia coli K-12 and Shigella flexneri. Our approach is then used to study the evolution of primates using mitochondrial DNA data. Our method allows us to reconstruct a phylogenetic tree for primate evolution. In addition, we use our technique to analyze the classification and phylogeny of the Tomato Yellow Leaf Curl Virus (TYLCV) based on its whole genome sequences. These examples show that large volumes of DNA sequences can be handled more easily and more quickly by our approach than by the existing multiple alignment methods. Moreover, our method, unlike other approaches, does not require human intervention, because it can be applied automatically.  相似文献   

19.
现有基于学习的人脸超分辨率算法假设高低分辨率特征具有流形一致性(耦合字典学习),然而低分辨率图像的降质过程使得高低分辨率特征产生了“一对多”的映射关系偏差,减少了极低分辨率图像特征的判决信息,降低了超分辨率重建图像的识别率。针对这一问题,引入了半耦合稀疏字典学习模型,松弛高低分辨率流形一致性假设,同时学习稀疏表达字典和稀疏表达系数之间的映射函数,提升高低分辨率判决特征的一致性,在此基础上,引入协同分类模型,实现半耦合特征的高效分类。实验表明:相比于传统稀疏表达分类算法,算法不仅提高了识别率,并且还大幅度降低了时间开销,验证了半耦合稀疏学习字典在人脸识别中的有效性。  相似文献   

20.
近年来,基于表示的人脸图像识别方法吸引了众多学者的关注,如稀疏表示分类方法(Sparse Representation based Classification,SRC)、协作表示方法(Collaborative Representation based Classification,CRC)等。这些方法均利用单张图像的表示信息进行识别,而忽略了集体图像之间的关联性,容易存在信息不足的缺陷。为了能够充分利用多张人脸图像的相互关系,提出了一类集体表示分类方法。该方法将多张待识别图像映射为一个稀疏表示矩阵,并对每类测试图像集体重构,以最小残差为准则对每类人脸图像集分类。这种方法通过同时表示多张图像,关注到不同图像之间的相似与不同,获取到同一主体的更多信息,从而提高识别正确率。尤其在只有多张侧脸图像而无正脸图像的情况下,集体表示分类方法更能发挥优势,在两个公开人脸图像数据集上的实验结果也验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号