首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
视觉单通道唇读系统的有效性   总被引:1,自引:0,他引:1       下载免费PDF全文
在建立视觉单通道的大词汇量唇读系统中,提出了归一化的U-LDCT-KL两级唇读特征提取方法,即针对唇区分块的DCT(Discrete Cosine Transform)系数进行二级KL(Karhunen-Loeve Transform)去局域参数的交叠。此方法一方面提取了唇读的最有效的低级语义特征,另一方面更加合理地选择利用了特征的有效可区分性,使得用42维二级视觉特征,对特定人的唇动内容识别正确率达到77.8%。实验还证明了系统中分块的唇区DCT特征对的视觉单通道唇读系统是最有效的。  相似文献   

2.
为了从生物特征和统计角度来提高识别的性能,提出了一种基于血流图的离散余弦变换(discrete cosine transform,DCT)与特征选择相结合的人脸识别方法。该方法首先利用血流模型把红外温谱图转换成血流图,得到更具丰富频率的特征。其次,采用DCT变换可以有效地消除血流图的相关性。最后,在DCT域特征提取阶段,为了提高特征提取的有效性,特征选择和子空间学习基于一致的可分性目标:特征选择引入基于可分性的DCT系数选择算法以抽取鉴别能力强的DCT系数,对抽取的DCT系数采用基于可分性的线性鉴别分析(linear discriminant analysis,LDA)方法。实验结果表明,该红外人脸识别方法可以快速有效地提取血流图中适合分类的特征,识别率优于传统DCT+LDA方法。  相似文献   

3.
在语音与唇读识别应用中,传统的LDA(linear discriminant analysis)算法一般以音节、半音节、HMM状态等基元为类别进行数据分段,经线性判别分析后获得的特征投影方向与识别率不直接相关,影响了识别率。提出了一种新的基于LDAO(linear discriminant analysis based on object)的唇读特征提取算法,该算法以待识别对象为类别进行线性判别分析,在理论上保证了唇读特征矢量向最具判别能力的方向投影。基于唇读数据库的实验证明,该算法明显优于现有各种唇读特征提取算法,比DCT+LDA算法识别率提高了3%。  相似文献   

4.
针对基于DCT变换与LDA的人脸识别方法识别率低和特征提取过程中维数也低,以及基于K-L变换的仿生人脸识别方法识别率高和特征提取过程中维数也过高的问题,结合两者的优点,提出了一种基于DCT与LDA变换的仿生人脸识别的方法。通过DCT变换与LDA对训练人脸样本进行特征提取,通过核函数将提取的特征映射到高维空间,构建各类样本的覆盖区域,再通过判断待识别人脸特征在各覆盖区域的归属情况来识别人脸。在Yale和ORL人脸库上的实验证明提出的方法取得了较好的识别效果。  相似文献   

5.
在基于加速度信号的人体行为识别中,LDA是较常用的特征降维方法之一,然而LDA并不直接以训练误差作为目标函数,无法保证获得训练误差最小的投影空间。针对这一情况,采用基于GA优化的LDA进行特征选择。提取加速度信号特征,利用PCA方法解决“小样本问题”,通过GA调整LDA中类间离散度矩阵的特征值矢量,使获得的投影空间训练误差最小。采用SVM对7种日常行为进行分类。实验结果表明,与单独采用PCA和采用PCA+LDA方法相比,基于GA优化的LDA算法在保证较高识别率的同时能有效降低特征维数并减小分类误差,最终测试样本的识别率可达95.96%。  相似文献   

6.
针对单视觉通道唇读系统中唇部特征的提取问题提出了基于DCT+ONPP的特征提取方法。相对于保持全局结构特性的PCA方法,ONPP是一种既保持局部部域几何特性又兼顾全局的线性降维技术。实验证明提出的方法优于DCT+PCA的特征提取方法。另外还对部域点个数对系统性能的影响做了相应的研究,发现部域点为3时该方法具有较好的识别效果。  相似文献   

7.
唇读中基于像素的特征提取方法的研究   总被引:3,自引:0,他引:3       下载免费PDF全文
针对单独视觉通道唇读中的基于像素的特征提取问题,提出一个级联的特征提取策略。首先对图像采用相应的变换,然后对变换结果降维,最后进行特征归一化。基于对几种变换方法的比较与分析,提出利用PCA对DCT和Gabor小波变换结果降维的DCT-PCA和Gabor-PCA方法,与传统人工选择变换系数的方法相比识别率提高了约10%。  相似文献   

8.
仅使用单一算法提取人脸图像的特征不足以捕捉人脸多方面的信息,为了更好地获取人脸面部特征,针对离散余弦变换(Discrete Cosine Transform,DCT)只能提取人脸面部图像的频域特征,而未考虑近邻像素之间的关系、不能提取纹理特质信息等问题进行了研究,提出一种融合DCT特征和伸长的局部二值模式(Elongated Local Binary Pattern,ELBP)的特征提取方法。该方法首先考虑将人脸图像经DCT变换后的少量低频系数作为人脸的频域特征,然后对人脸图像中贡献相对较大的眼部和嘴部区域进行ELBP特征提取,将该ELBP特征作为人脸的空域特征,并采用PCA方法对所提取的空频域特征进行有效融合,得到更有效的人脸特征,最后用最近邻分类器进行识别。在ORL人脸库和Yale人脸库上的实验结果表明:所提方法比单独采用DCT、ELBP方法或采用DCT和LBP相结合的方法提取的特征更有利于识别,提高了识别的准确性。  相似文献   

9.
基于特征融合的被动声纳目标识别   总被引:1,自引:0,他引:1  
在被动声纳目标的分类识别中,不同的特征提取方法提取的特征反映了噪声信号不同的特性,一般情况下,很难做出某种方法优劣的判断.如何把这些不同的特征提取方法提取的特征矢量融合起来,对被动声纳目标分类识别非常有意义.在应用数据融合的方法对基于倒谱的特征提取方法、基于局域判别基的特征提取方法和基于听觉响度特征提取方法提取的特征矢量进行融合.提出了基于正态分布的概率密度函数的确定基本概率赋值的方法,利用三种特征提取方法对水声目标噪声信号进行特征提取,对提取的特征矢量进行融合,并进行分类实验,结果表明,特征融合使分类过程中的不确定性样本数减少,从而相应地提高目标分类的正确概率.  相似文献   

10.
融合PCA与LDA变换的仿生人脸识别研究   总被引:3,自引:1,他引:2       下载免费PDF全文
就基于PCA与LDA变换的传统人脸识别方法识别率低但特征提取过程中维数低和基于K-L 变换的仿生人脸识别方法识别率高但在特征提取过程中维数过高的的问题,将两者的优点相结合,提出了一种基于PCA与LDA变换的仿生人脸识别新方法。通过PCA与LDA变换对训练人脸样本进行特征提取,然后构建各类样本的覆盖区域。再通过判断待识别人脸特征在各覆盖区域的归属情况来识别人脸。实验收到了预期的效果,证明了方法的可行性。  相似文献   

11.
In this paper, a visual object tracking method is proposed based on sparse 2-dimensional discrete cosine transform (2D DCT) coefficients as discriminative features. To select the discriminative DCT coefficients, we give two propositions. The propositions select the features based on estimated mean of feature distributions in each frame. Some intermediate tracking instances are obtained by (a) computing feature similarity using kernel, (b) finding the maximum classifier score computed using ratio classifier, and (c) combinations of both. Another intermediate tracking instance is obtained using incremental subspace learning method. The final tracked instance amongst the intermediate instances are selected by using a discriminative linear classifier learned in each frame. The linear classifier is updated in each frame using some of the intermediate tracked instances. The proposed method has a better tracking performance as compared to state-of-the-art video trackers in a dataset of 50 challenging video sequences.  相似文献   

12.
文章抓住人类语音感知多模型的特点,尝试建立一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种基于特征口形的提取方法。识别实验证明,这种视频特征提取方法比传统DCT、DWT方法能够带来更高的识别率;基于特征口形的音频-视频混合连续语音识别系统具有很好的抗噪性。  相似文献   

13.
基于DDCT与TCSVD的人脸特征提取与识别算法   总被引:2,自引:1,他引:1       下载免费PDF全文
提出一种基于分块离散余弦变换(DCT)与奇异值分解阈值压缩(TCSVD)的人脸特征提取与识别算法。该算法对人脸图像进行分块DCT变换,根据图像块位置和能量分布选择不同的DCT高低频分量构建特征矩阵,通过对每个图像块的特征矩阵进行SVD阈值压缩和特征组合来构建人脸鉴别特征,并利用分类器进行特征分类与识别。AR人脸库上的实验结果验证了该算法的有效性。  相似文献   

14.
Discrete cosine transform (DCT) is a powerful transform to extract proper features for face recognition. After applying DCT to the entire face images, some of the coefficients are selected to construct feature vectors. Most of the conventional approaches select coefficients in a zigzag manner or by zonal masking. In some cases, the low-frequency coefficients are discarded in order to compensate illumination variations. Since the discrimination power of all the coefficients is not the same and some of them are discriminant than others, so we can achieve a higher true recognition rate by using discriminant coefficients (DCs) as feature vectors. Discrimination power analysis (DPA) is a statistical analysis based on the DCT coefficients properties and discrimination concept. It searches for the coefficients which have more power to discriminate different classes better than others. The proposed approach, against the conventional approaches, is data-dependent and is able to find DCs on each database. The simulations results of the various coefficient selection (CS) approaches on ORL and Yale databases confirm the success of the proposed approach. The DPA-based approaches achieve the performance of PCA/LDA or better with less complexity. The proposed method can be implemented for any feature selection problem as well as DCT coefficients. Also, a new modification of PCA and LDA is proposed namely, DPA-PCA and DPA-LDA. In these modifications DCs which are selected by DPA are used as the input of these transforms. Simulation results of DPA-PCA and DPA-LDA on the ORL and Yale database verify the improvement of the results by using these new modifications.  相似文献   

15.
王希花  郭洪杰  黄威 《测控技术》2012,31(12):36-40
人脸特征提取是人脸识别中重要的一个环节。提出了一种新的方法,利用DCT对人脸图像压缩降维,然后对DCT系数用20组Gabor小波滤波,滤波后的结果采用选择性分块统计方法提取特征向量。最后把特征向量用改进型感知器算法进行分类。以VC++6.0为开发平台在Yale人脸库和0RL人脸库上对该方法进行了测试。实验表明,该方法与常用的PCA、LDA等特征提取方法相比可以有效降低运算时间,并提高识别率。  相似文献   

16.

Presently, while automated depression diagnosis has made great progress, most of the recent works have focused on combining multiple modalities rather than strengthening a single one. In this research work, we present a unimodal framework for depression detection based on facial expressions and facial motion analysis. We investigate a wide set of visual features extracted from different facial regions. Due to high dimensionality of the obtained feature sets, identification of informative and discriminative features is a challenge. This paper suggests a hybrid dimensionality reduction approach which leverages the advantages of the filter and wrapper methods. First, we use a univariate filter method, Fisher Discriminant Ratio, to initially reduce the size of each feature set. Subsequently, we propose an Incremental Linear Discriminant Analysis (ILDA) approach to find an optimal combination of complementary and relevant feature sets. We compare the performance of the proposed ILDA with the batch-mode LDA and also the Composite Kernel based Support Vector Machine (CKSVM) method. The experiments conducted on the Distress Analysis Interview Corpus Wizard-of-Oz (DAIC-WOZ) dataset demonstrate that the best depression classification performance is obtained by using different feature extraction methods in combination rather than individually. ILDA generates better depression classification results in comparison to the CKSVM. Moreover, ILDA based wrapper feature selection incurs lower computational cost in comparison to the CKSVM and the batch-mode LDA methods. The proposed framework significantly improves the depression classification performance, with an F1 Score of 0.805, which is better than all the video based depression detection models suggested in literature, for the DAIC-WOZ dataset. Salient facial regions and well performing visual feature extraction methods are also identified.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号