首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
启动子识别是生物信息学的一个重要研究方向,根据启动子本身的特点已经有基于信号、内容和CpG岛等多种识别算法。针对基因序列数据数据量大、维数高、非线性的特点,提出了基于流形结构重建的启动子识别算法,先利用非线性降维方法压缩数据,然后再进行启动子识别。实验结果表明,该方法能够取得较好的结果。  相似文献   

2.
传统的等距特征映射算法在降维时未考虑数据的类别标签,降维后不能够产生从高维到低维的映射矩阵,且不适用于多个类簇的情况,不能直接用于分类。针对这几个问题利用近邻元分析方法取代多维尺度分析法,并且引入特征向量作为输入矩阵,提出一种以分类为目的的等距特征映射算法(NC-ISOMAP)。降维时获取理想的低维投影矩阵,使降维后类间数据更加分开,类内数据更加紧凑。实验结果表明NC-ISOMAP算法能够取得很好的降维效果和分类性能,并在不同的数据集中有着较好的鲁棒性。  相似文献   

3.
非线性流形学习可以准确反映现实非线性数据本质并进行较好的降维,但在语音情感识别过程中难以有效处理不断增加的语音数据集,也不能充分利用训练过程中的情感特征信息。针对上述情况,提出一种基于增量流形学习的语音情感特征降维方法。该方法利用等距映射将训练样本特征维数降至目标维数后,通过增量流形学习的方法分批求得测试样本的低维特征。实验结果表明,相比同类方法,该方法具有较低的运算复杂度和较高的识别率。  相似文献   

4.
近年来出现的一系列进行维数约简的非线性方法——流形学习中等距映射(Isomap)是其中的代表,该算法高效、简单,但计算复杂度较高。基于标志点(Landmark Points)的L-Isomap减少了计算复杂度,但对于标志点的选取,大都采用随机的方法,致使该算法不稳定。考虑到样本点和近邻点相对位置,将对嵌入流形影响较大的样本点赋予较高的权重。然后根据权重大小选择标志点,同时考虑标志点之间的相对位置,使得选出的标志点不会出现过度集中的现象,近似直线分布的概率也大大降低,从而保证了算法的稳定性。实验结果表明,该算法在标志点数量较少的情况下,比L-Isomap稳定,且对缺失数据的不完整流形,也能获取和Isomap相差不大的结果。  相似文献   

5.
介绍了局部线性嵌套和等距映射两种最基本的非线性降维方法,对比测试了两种降维方法在不同参数下的执行效果与效率,总结了两种降维方法所适合的数据特点,并应用于图像识别中,比较了两者在图像识别中的识别率.  相似文献   

6.
杜奕  张挺  黄涛 《计算机研究与发展》2016,53(12):2801-2815
在空间数据重建过程中,条件数据对重建结果影响较大,在仅有少量条件数据的情况下,重建结果常常出现较多的不确定性,此时适合采用不确定性插值方法重建空间数据.作为目前不确定性插值的主流方法之一,多点信息统计法(multiple-point statistics, MPS)可以从训练图像提取模式的本质特征,然后将这些特征复制到待模拟区域.由于传统采用线性降维的MPS方法无法有效处理非线性数据,因此将等距特征映射(isometric mapping, ISOMAP)应用到MPS方法,以实现对非线性数据的降维.提出基于MPS和ISOMAP的空间数据重建方法,通过模式库构建、模式降维、模式分类、模式提取等步骤能够较为准确地重构出未知的空间数据,为MPS处理非线性空间数据提供了新思路.实验结果表明:该方法所重建的空间数据具有与训练图像相似的结构特征.  相似文献   

7.
一种新的有监督流形学习方法   总被引:2,自引:0,他引:2  
提出了一种新的有监督流形学习方法,目的是提供将流形学习降维方法高效应用于有监督学习问题的全新策略.算法的核心思想是集成流形学习方法对高维流形结构数据的降维有效性与支撑向量机(SVM)在中小规模分类数据集上的优良特性实现高效有监督流形学习.算法具体实现步骤为:首先利用SVM在流形学习降维数据中选出对分类决策最重要的数据集,即支撑向量集;按标号返回可得到原空间的支撑向量集;在这个集合上再次使用SVM即可得到原空间的分类决策,从而完成有监督流形学习.在一系列人工与实际数据集上的实验验证了方法的有效性.  相似文献   

8.
流形学习方法中的若干问题分析   总被引:4,自引:0,他引:4  
流形学习是近年来机器学习与认知科学中的一个新的研究热点,其本质在于根据有限的离散样本学习和发现嵌入在高维空间中的低维光滑流形,从而揭示隐藏在高维数据中的内在低维结构,以实现非线性降维或者可视化.介绍了几种主要的流形学习算法,分析了它们的优势与不足,总结了流形学习方法中需要解决的若干问题及其研究现状,并展望了流形学习未来的研究前景.  相似文献   

9.
古楠楠  孟德宇  徐宗本 《软件学报》2010,21(8):1898-1907
针对位于非连通流形上的数据的特征提取是流形学习领域的一个公开问题,分解-整合算法是目前处理此问题的最有效的方法.然而,此算法的最大局限是边缘问题,即当不同类间的最短距数据对位于相应类内而非类边缘时,算法往往表现异常.针对这一关键问题,提出了一种解决方法——过渡曲线方法.其主要思想为,通过构建连接不同类边缘最短距数据对间的平滑过渡曲线以使流形类间的连接关系更为有效,进而使得数据的全局形态在低维空间中能够更好地保持.一系列人工与图像数据集上的实验结果表明,过渡曲线方法的表现明显优于分解-整合算法,特别是,边缘问题得到了解决,这极大地扩展了分解-整合算法的应用范围.  相似文献   

10.
张绍群 《计算机科学》2017,44(Z6):88-91
年以后新兴了一系列非线性降维的方法,流形学习中的Isomap就是其中的代表。该算法能够反映数据集的全局结构且简单高效,但是存在低维流形等距的欧氏子集必须是凸集和计算复杂度高等缺点。L-Isomap成功降低了算法的计算复杂度,但是对于地标点(landmark points)的选取大多采用随机的方法,致使该算法不稳定。依据拓扑学和泛函分析中有限维空间有界闭集与紧集(compact set)等价、紧集的任一开覆盖存在有限子覆盖等经典定理,分析数据集所在区域的拓扑结构,确定了一系列能够反映数据结构的地标点。这样的方法计算复杂度低,比L-Isomap稳定,且将数据集是凸集的要求弱化到紧集(有界闭集),避免了传统Isomap算法放大不完整流形中的“空洞”误差等问题。  相似文献   

11.
张燕  卓力  成博  张菁 《测控技术》2014,33(12):8-10
"维度灾难"是基于内容的图像检索(CBIR,content-based image retrieval)技术需要重点解决的关键问题。局保投影(LPP,locality preserving projections)流形学习算法可以最大限度地保留图像的局部非线性结构,从而更能够保留图像的本质特征。利用LPP流形学习算法的特性,在CBIR框架下,提出了一种图像检索特征降维方法。实验结果表明,方法在保持与原始特征基本相当的检索性能情况下,特征比对的计算复杂度可以降低66.51%。  相似文献   

12.
Isomap is one of widely used low-dimensional embedding methods, where geodesic distances on a weighted graph are incorporated with the classical scaling (metric multidimensional scaling). In this paper we pay our attention to two critical issues that were not considered in Isomap, such as: (1) generalization property (projection property); (2) topological stability. Then we present a robust kernel Isomap method, armed with such two properties. We present a method which relates the Isomap to Mercer kernel machines, so that the generalization property naturally emerges, through kernel principal component analysis. For topological stability, we investigate the network flow in a graph, providing a method for eliminating critical outliers. The useful behavior of the robust kernel Isomap is confirmed through numerical experiments with several data sets.  相似文献   

13.
罗晓慧  李凡长  张莉  高家俊 《软件学报》2020,31(4):991-1001
流形学习是当今最重要的研究方向之一.约简维度的选择影响着流形学习方法的性能.当约简维度恰好是本征维度时,更容易发现原始数据的内在性质.然而,本征维度估计仍然是流形学习的一个研究难点.在此基础上,提出了一种新的无监督方法,即基于选择聚类集成的相似流形学习(SML-SCE)算法,避免了对本征维度的估计,并且性能表现良好.SML-SCE利用改进的层次平衡K-means(MBKHK)方法生成具有代表性的锚点,高效地构造相似度矩阵.随后计算得到了多个不同维度下的相似低维嵌入,这些低维嵌入是对原始数据的不同表示,而且不同低维嵌入之间的多样性有利于集成学习.因此,SML-SCE采用选择性聚类集成方法作为结合策略.对于通过K-means聚类得到的相似低维嵌入的聚类结果,采用聚类间的归一化互信息(NMI)作为权重的衡量标准.最后,舍弃权重较低的聚类,采用基于权重的选择性投票方案,得到最终的聚类结果.在多个数据集的大量实验结果表明了该方法的有效性.  相似文献   

14.
本文研究了基于Isomap的非线性降维方法,对由面部表情序列提取的面部动画参数特征进行降维,分析了降维后的流形特征空间与认知心理学情感空间之间的关系。实验结果表明,Isomap降维后的情感流形特征能够表现情感的强度变化,而且比PCA降维特征对情感强度的描述更加合理和平滑;情感识别实验也表明,使用Isomap降维流形特征的识别率要高于原始情感特征和PCA降维特征,而且对各种情感的识别结果更加均衡。  相似文献   

15.
Isomap算法嵌入向量求解依赖于所有的初始样本,在增加新数据时需要较长时间重新计算所有数据样本间的测地距离.为了提高运算速度,提出一种基于核函数的增量学习Isomap算法,将测地距离矩阵当作一个核矩阵,并通过常数增加的方法保证测地距离矩阵满足Mercer条件,算法只需要计算新增点与原有数据点间的测地距离.与核主成分算法一样,新增点的投影值计算变为核矩阵上的特征分解.在Swiss,Helix和多姿态人脸数据中的实验结果表明,算法大大降低了计算复杂度,有利于快速发现隐藏在高维空间的低维流形分布.  相似文献   

16.
刘利  陶丹  陈慧芬 《计算机工程》2012,38(11):202-204,207
当检索样例位于数据库之外时,传统基于线性流形学习的图像检索方法在反馈迭代后的检索精度提高较小。为此,提出一种基于相关反馈和流形结构重构的图像检索方法。反馈时计算被检索样例的最邻近点,将被检索样例重构入需要保留的结构图中,从而满足映射时需保证相似图像和被检索样例距离尽可能近的要求。实验结果表明,该方法在额外耗时较少的情况下,能有效提高检索精度。  相似文献   

17.
针对环状流形数据的非线性降维   总被引:1,自引:0,他引:1  
孟德宇  古楠楠  徐宗本  梁怡 《软件学报》2008,19(11):2908-2920
近年来出现了多种新型的非线性降维方法,且在一些应用中体现出良好的效果.然而,当面对球体、柱体等环状流形产生的非线性流形数据时,这些方法往往会失效.针对这一问题,提出了针对环状流形数据的环结构检测算法与非线性降维方法.理论上,基于目前极受关注的Isomap降维方法的运行原理,给出了一个判断环状流形的充要条件;算法上利用所得的判断定理,制订了基于数据的环状流形检测算法:最后基于所找到的环结构,利用极坐标展开的思想设计了针对环状流形数据的非线性降维策略.针对一系列典型环状流形数据集的仿真实验结果表明,与其他流形学习降维方法相比,该方法对环状流形数据进行降维具有显著优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号