首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
PCA是一种常用的线性降维方法,但在实际应用中,当数据规模比较大时无法将样本数据全部读入内存进行分析计算。文章提出了一种针对较大规模数据应用PCA进行降维的方法,该方法在不借助Hadoop云计算平台的条件下解决了较大规模数据不能直接降维的问题,实际证明该方法具有很好的应用效果。  相似文献   

2.
基于混合概率PCA模型高光谱图像本征维数确定   总被引:1,自引:1,他引:1       下载免费PDF全文
普鑫 《计算机工程》2007,33(9):204-206
如何有效实现降维是现代成像光谱仪辨识地物类别的一个难点所在。该文在已知高光谱图像地物类别数的情况下,提出了一种采用混合最小描述长度(MMDL)模型选择准则确定高光谱图像本征维数的方法。该方法在期望最大化算法框架下同时实现混合PPCA降维和聚类,并根据MMDL准则确定数据降维维数,可以得到数据在概率意义下的精确的降维表征。仿真数据和真实数据进行的比较实验表明,该方法能精确地选择数据的本征维数。  相似文献   

3.
高维心电图数据存在大量不相关特征,基于监督机器学习技术很难同时获得较高敏感性与特异性。在预处理操作心电图数据,如校准基线漂移、去除高频噪声和拟合多项式特征的基础上,提出一种基于监督多元对应分析(MCA)降维技术的分类模型自动分类心跳。该方法离散化连续心电图数据为类属数据,并发展有监督MCA降维技术提取心电图数据关键特征,用各种分类算法自动分类心电图心跳数据。在PTB诊断数据库的心电图数据集上测试结果表明,与几种基于监督机器学习分类技术相比,在监督MCA降维框架中各种分类算法能以较高敏感性和特异性自动分类心电图心跳数据。  相似文献   

4.
局部保持投影(LPP)是一种新的数据降维技术,但其本身是一种非监督学习算法,对于分类问题效果不是太好。基于自适应最近邻,结合LPP算法,提出了一种有监督的局部保持投影算法(ANNLPP)。该方法通过修改LPP算法中的权值矩阵,在降维的同时,增加了类别信息,是一种有监督学习算法。通过二维数据可视化和UMIST、ORL 人脸识别实验,表明该方法对于分类问题具有较好的降维效果。  相似文献   

5.
一种面向大规模图像库的降维索引新方法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对图像的72维HSV颜色特征,提出了一种新的降维方法。该方法在降维的过程中充分保留了图像颜色的本征特性。在降维的基础上,建立了一个新的索引机制,并以此加速大规模图像库的基于内容检索的进程。实验证明,该方法是行之有效的。  相似文献   

6.
传统社团结构发现算法复杂度高,且只适合处理小规模低维度的社会网络数据,而无法处理大规模高维度实际网络数据。为此,提出一种基于压缩感知的社团结构深度学习方法。通过随机测量矩阵对社会网络数据进行特征降维,并使用深度信度网(DBN)对降维后的特征样本集进行无监督学习,利用带类标的小样本集进行有监督调优。仿真结果表明,随机测量方法对高维稀疏特征具有较好的降维效果,DBN对大规模数据集具有较好的处理性能,该方法适合对大规模高维度实际社会网络数据进行高效处理。  相似文献   

7.
基于LDA模型的文本分类研究   总被引:3,自引:0,他引:3       下载免费PDF全文
针对传统的降维算法在处理高维和大规模的文本分类时存在的局限性,提出了一种基于LDA模型的文本分类算法,在判别模型SVM框架中,应用LDA概率增长模型,对文档集进行主题建模,在文档集的隐含主题-文本矩阵上训练SVM,构造文本分类器。参数推理采用Gibbs抽样,将每个文本表示为固定隐含主题集上的概率分布。应用贝叶斯统计理论中的标准方法,确定最优主题数T。在语料库上进行的分类实验表明,与文本表示采用VSM结合SVM,LSI结合SVM相比,具有较好的分类效果。  相似文献   

8.
融合LLE和ISOMAP的非线性降维方法   总被引:1,自引:0,他引:1  
局部线性嵌入(LLE)和等距映射(ISOMAP)在降维过程中都只单一地保留数据集的某一种特性结构, 从而使降维后的数据集往往存在顾此失彼的情况。针对这种情况, 借助流形学习的核框架, 提出融合LLE和ISOMAP的非线性降维方法。新的融合方法使降维后的数据集既保持着数据点间的局部邻域关系, 也保持着数据点间的全局距离关系。在仿真数据集和实际数据集上的实验结果证实了该方法的优越性。  相似文献   

9.
尹宝才    张超辉  胡永利    孙艳丰    王博岳   《智能系统学报》2021,16(5):963-970
随着监控摄像头的普及和数据采集技术的快速发展,多视数据呈现出规模大、维度高和多源异构的特点,使得数据存储空间大、传输慢、算法复杂度高,造成“有数据、难利用”的困境。到目前为止,国内外在多视降维方面的研究还比较少。针对这一问题,本文提出一种基于图嵌入的自适应多视降维方法。该方法在考虑视角内降维后数据重构原始高维数据的基础上,提出自适应学习相似矩阵来探索不同视角之间降维后数据的关联关系,学习各视数据的正交投影矩阵实现多视降维任务。本文在多个数据集上对降维后的多视数据进行了聚类/识别实验验证,实验结果表明基于图嵌入的自适应多视降维方法优于其他降维方法。  相似文献   

10.
传统数据降维算法分为线性或流形学习降维算法,但在实际应用中很难确定需要哪一类算法。设计一种综合的数据降维算法,以保证它的线性降维效果下限为主成分分析方法且在流形学习降维方面能揭示流形的数据结构。通过对高维数据构造马尔可夫转移矩阵,使越相似的节点转移概率越大,从而发现高维数据降维到低维流形的映射关系。实验结果表明,在人造数据以及真实数据的线性降维中,该算法降维效果与主成分分析算法相当而局部线性嵌入失败;在流形学习降维中,该算法与局部线性嵌入基本相当而主成分分析算法完全失败。  相似文献   

11.
刘美茹 《计算机工程》2007,33(15):217-219
文本分类技术是文本数据挖掘的基础和核心,是基于自然语言处理技术和机器学习算法的一个具体应用。特征选择和分类算法是文本分类中两个最关键的技术,该文提出了利用潜在语义索引进行特征提取和降维,并结合支持向量机(SVM)算法进行多类分类,实验结果显示与向量空间模型(VSM)结合SVM方法和LSI结合K近邻(KNN)方法相比,取得了更好的效果,在文本类别数较少、类别划分比较清晰的情况下可以达到实用效果。  相似文献   

12.
一种压缩域特征提取与语义图像检索技术   总被引:1,自引:0,他引:1  
为了解决“语义鸿沟”问题,通过将隐含语义索引(LSI)技术引入到图像语义提取问题的研究中,试图从图像的视觉特征中抽取出“高层概念”.基于GM(1,1)压缩域中的一种图像特征,提出了一种建立“图像视觉特征”与“语义信息”之间映射的技术方法.实验研究表明,这种基于压缩域特征和LSI技术的图像检索方法能显著改善图像检索的性能,提高图像检索的质量.  相似文献   

13.
在实体建模中,奇异特征的存在阻碍了基于特征的数据交换的顺利进行。针对该问题,提出一种在特征交换框架下基于几何操作的奇异特征交换方法,通过将奇异特征转化为一组与之等价的几何操作实现奇异特征的交换。实验结果表明,该方法能有效解决异构CAD系统间奇异特征的交换问题。  相似文献   

14.
An image sequence-based framework for appearance-based object recognition is proposed in this paper. Compared with the methods of using a single view for object recognition, inter-frame consistencies can be exploited in a sequence-based method, so that a better recognition performance can be achieved. We use the nearest feature line (NFL) method (IEEE Trans. Neural Networks 10 (1999) 439) to model each object. The NFL method is extended in this paper by further integrating motion-continuity information between features lines in a probabilistic framework. The associated recognition task is formulated as maximizing an a posteriori probability measure. The recognition problem is then further transformed to a shortest-path searching problem, and a dynamic-programming technique is used to solve it.  相似文献   

15.
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。  相似文献   

16.
在对HUST-CAID(哈尔滨理工大学计算机辅助工业造型设计)系统进行研究的基础上,首先引入了自由曲面特征,然后结合HUST-CAID系统定义了自由曲面特征的分类和参数化,应用这种分类和参数化的方法创建了一个自由曲面特征,提出了一种基于FFDP配置的附加自由曲面特征的构造框架。此框架可以使自由曲面整体模型的构造完全参数化。最后建立了基于这个框架构造的自由曲面附加特征的有效性维护机制,从而达到对自由曲面附加特征进行有效性维护的目的。  相似文献   

17.
1IntroductionWiththegrowingcompetitioninthemanufactureindustry,thedevelopingperiodofproductisshorterandshorter.Soamanufacturi...  相似文献   

18.
李旻松  段琢华 《计算机应用》2011,31(9):2429-2431
隐含语意索引(LSI)是一个能有效捕获文档中词的隐含语意特征的方法。然而,用该方法选择的特征空间对文本分类来说可能不是最适合的,因为这种方法按照词的变化排序特征,而没有考虑到分类能力。支持向量机(SVM)高度的泛化能力使它特别适用于高维数据例如文档的分类。为此提出基于支持向量机的特征提取方法用于选择适于分类的LSI特征。该方法利用SVM高度泛化的分类能力, 通过使用在每一个规则下训练的分类器的参数对第k个特征对反向平方分解面的贡献w2k的值进行估计。实验表明当需要比LSI更少的训练和测试时间时,该方法能够以更为紧凑的表示方式提高分类性能。  相似文献   

19.
基于特征区域的图像自动配准   总被引:1,自引:0,他引:1  
为了解决基于特征的图像配准中的特征点的定义和提取问题,提出了一种以特征区域替代特征点的定义和提取方法。该方法应用Moravec算子选择候选特征区域,使用具有旋转不变性的Zernike矩表征该区域的特性;采用二级匹配策略进行特征区域的匹配,即基于自组织映射神经网络的初始匹配及精细匹配;建立图像的配准框架并实现图像的配准。实验结果表明,该方法能有效地提取图像的特征点并能准确地进行特征点的匹配,整个配准过程完全自动进行。  相似文献   

20.
一种神经网络文本分类器的设计与实现   总被引:1,自引:0,他引:1  
李斗  李弼程 《计算机工程与应用》2005,41(17):107-109,119
论文着重介绍了一种基于神经网络的文本分类器,分类器使用神经网络作为分类工具,特征词的词频组成原始特征向量,和神经网络输入层的神经元一一对应。并引入了信息检索中的常用技术——潜在语义索引,训练过程中结合遗传算法,优化神经网络的初始权值。最后对分类器进行了开放性测试,实验表明分类器对文本分类具有较高的平均查全率和平均精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号