期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

梁泽马义德张恩溯朱望飞汤书森《计算机应用》2008,28(3):710-713

针对汉语语音情感识别问题,提出了一种基于脉冲耦合神经网络(PCNN)的识别方法。该方法将语音转化为语谱图后输入到PCNN,得到输出图像的神经元点火序列及其熵序列作为语音情感的特征,利用其特征实现语音情感识别。实验结果表明,该方法可以有效地识别“高兴”与“平常”这两种不同的情感。该方法将PCNN引入到语音情感识别的应用研究中,开拓了语音和图像信号结合处理的新领域,同时对于PCNN的理论研究和实际应用具有重要的现实意义。相似文献

2.

利用PCNN神经元点火位置信息的语音特征研究

下载免费PDF全文

张歆奕阮柏尧《计算机工程与应用》2009,45(34):124-126

语谱图是语音信号的时频表示,含有丰富的信息。把语谱图输入到脉冲耦合神经网络(PCNN)可以获得语音的特征矢量。传统的语音特征采用PCNN50次迭代的点火次数。提出了一种新的语音特征参数,该参数基于PCNN神经元点火位置的信息。说话人识别的实验表明,新语音特征比传统的特征更能反映话者语音信号的特点,获得更好的识别结果。相似文献

3.

基于PCNN和RBF的孤立词语音识别研究 总被引：1，自引：0，他引：1

刘琨金文标《计算机工程与设计》2008,29(24)

通过对孤立词语音识别现状的研究,提出了一种利用简化脉冲耦合神经网络PCNN和径向基函数RBF神经网络进行语音识别的新方法.利用语音信号的"可视"特性--语谱图,采用PCNN得到它的时间序列标识图作为语音信号的特征参数,辅以传统的RBF的语音识别方法,实现了孤立词语音识别.仿真结果表明,与其它方法比较,该方法能够达到较高的语音识别率. 相似文献

4.

改进脉冲耦合神经网络的语音识别研究

张晓俊陶智施晓敏顾济华《计算机工程与应用》2007,43(8):51-53

提出了一种改进脉冲耦合神经网络(IPCNN)实现语音识别的方法。首先利用IPCNN来快速提取语音的语谱图图像特征,然后由概率神经网络(PNN)辅助来识别语音。通过训练语音样本来构成语音识别库并建立综合识别系统。实验结果表明,该方法相对于单独使用PCNN和PNN识别率分别提高了22.7%和39.4%,达到92%的识别率。相似文献

5.

一种基于GMM模型的语音情感识别方法

黄锋尹俊勋《微计算机信息》2009,25(10)

在人机语音交互系统中,机器不仅要具有理解人类语音的能力,还应当具有识别说话人情感的能力.本文提出了基于高斯混合模型(GMM)的序列分类和识别的改进方法,并将该方法引入到语音情感识别的研究中.本文提出了观测值次序均衡的方法.实验结果证明这种新的方法有效地提高了语音情感识别的准确率. 相似文献

6.

基于深度循环网络的声纹识别方法研究及应用

余玲飞《计算机应用研究》2019,36(1)

声纹识别是当前热门的生物特征识别技术之一,能够通过说话人的语音识别其身份。针对声纹识别技术进行了研究,提出了一种基于卷积神经网络（CNN）和深度循环网络（RNN）的声纹识别方案CDRNN,CDRNN结合CNN和RNN的优势,用于移动终端声纹识别应用。CDRNN将说话者的原始语音信息经过一系列的处理并生成一张二维语谱图,利用CNN长于处理图像的优势从语谱图中提取语音信号的个性特征,这些个性特征再输入到Deep RNN中完成声纹识别,从而确定说话者的身份。实验结果表明了CDRNN方案能够获得比GMM-UBM等其他方案更好的识别准确率。相似文献

7.

宽窄带语谱图融合分带投影的特定人汉语词汇识别

魏莹王双维潘迪张玲许廷发梁士利《计算机科学》2016,43(Z11):215-219, 232

提出一种基于宽窄带语谱图融合分带投影的方法对特定人二字汉语词汇进行识别。该方法将图像处理技术应用到语音识别领域,在图像特征提取过程中,首先对窄带语谱图进行等宽度分带行投影和二进宽度分带行投影,并将其分别作为窄带语谱图的第1个特征集合和第2个特征集合,同时将窄带语谱图进行再次图像傅里叶变换之后进行等宽度行投影,作为第3个特征集合。然后对宽带语谱图进行等宽度分带列投影,作为第4个特征集合。将上述特征集合作为识别的特征向量,以支持向量机为分类器进行特定人二字汉语词汇整体识别。采用1000个语音样本进行仿真实验,结果表明,采用前3个特征集合的特征向量对特定人二字汉语词汇识别的正确识别率可达92.4%,采用第4个特征集合的特征值对特定人二字词汇识别的正确识别率可达80%,而采用上述4个特征集合的特征值融合对特定人二字汉语词汇识别的正确识别率可达95.4%。该特征融合的方法为汉语词汇的识别提供了新的思路。相似文献

8.

基于分布特征统计的说话人识别 总被引：2，自引：2，他引：0

下载免费PDF全文

李邵梅郭云飞卫红权《计算机工程与应用》2009,45(34):118-120

给出了基于公共码书的说话人分布特征的定义。提出了基于分布特征统计的说话人识别算法,根据所有参考说话人的训练语音建立公共码书,实现对语音特征空间的分类,统计各参考说话人训练语音的在公共码字上的分布特征进行建模。识别中引入双序列比对方法进行识别语音的分布特征统计与参考说话人模型间的相似度匹配,实现对说话人的辨认。实验表明,该方法保证识别率的情况下,进一步提高了基于VQ的说话人识别的速度。相似文献

9.

生物特征识别技术之语音识别

杜利民《中国自动识别技术》2007,(3):59-63

语音识别技术的基本任务是将人说话发出的声波信号转换成为一种能够表达口语消息的符号序列。关于语音识别的研究从二十世纪50年代开始到现在的半个多世纪里一直非常活跃。本文将从语音识别的方法、技术原理和发展趋势等多方面进行阐述,便于读者全面了解语音识别现阶段的技术成果和未来走势。相似文献

10.

基于参数迁移和卷积循环神经网络的语音情感识别

下载免费PDF全文

缪裕青邹巍刘同来周明蔡国永《计算机工程与应用》2019,55(10):135-140

在语音情感识别研究中,已有基于深度学习的方法大多没有针对语音时频两域的特征进行建模,且存在网络模型训练时间长、识别准确性不高等问题。语谱图是语音信号转换后具有时频两域的特殊图像,为了充分提取语谱图时频两域的情感特征,提出了一种基于参数迁移和卷积循环神经网络的语音情感识别模型。该模型把语谱图作为网络的输入,引入AlexNet网络模型并迁移其预训练的卷积层权重参数,将卷积神经网络输出的特征图重构后输入LSTM（Long Short-Term Memory）网络进行训练。实验结果表明,所提方法加快了网络训练的速度,并提高了情感识别的准确率。相似文献

11.

基于小波变换与脉冲耦合神经网络的人脸识别

何世强刘金清刘引蔡淑宽陈存弟周晓童邓淑敏吴庆祥《计算机系统应用》2017,26(10):231-235

脉冲耦合神经网络（Pulse Coupled Neural Network,PCNN）是基于生物视觉特性而提出的新一代人工神经网络,它在数字图像处理及人工智能等领域具有广泛应用前景.本文通过研究PCNN理论模型及其工作特性的基础上提出了一种提取人脸特征的方法.首先利用小波变换提取人脸图像低频特征,降低人脸图像的维度,然后利用简化的PCNN提取小波低频系数重构后的人脸图像的相应时间序列,并以此作为人脸识别的特征序列.最后利用时间序列和欧式距离完成人脸的识别过程.本文通过ORL人脸库进行实验证明了该方法的有效性. 相似文献

12.

一种基于PCNN的指纹特征提取算法

李双科吴记群孙传庆《自动化与仪器仪表》2011,(5):134-135,137

具有生物背景的脉冲耦合神经网络具有自适应提取指纹特征的特性,基于此,首次提出了一种指纹图像特征提取的新方法一一自适应耦合神经网络点火统计图的,此图不仅包含了指纹图像的灰度特征,还包含相邻像素之间的几何位置信息。此方法具有运算速度快及对旋转、平移、尺度不变性,是许多指纹特征提取算法不具备的优点。最后给出了部分实验的结果,以验证该方法的有效性．相似文献

13.

Automatic image segmentation based on PCNN with adaptive threshold time constant 总被引：7，自引：0，他引：7

Shuo WeiAuthor VitaeQu HongAuthor Vitae Mengshu HouAuthor Vitae 《Neurocomputing》2011,74(9):1485-1491

PCNN is a novel neural network model to simulate the synchronous phenomenon in the visual cortex system of the mammals. It has been widely used in the field of image processing and pattern recognition. However, there are still some limitations when it is applied to solve image processing problems, such as trial-and-error parameter settings and manually selection of the final results. This paper studies a simple model of PCNN(S-PCNN) and applies it to image segmentation. The main contributions of this paper are: (1) A new method based on the simplified model of PCNN is proposed to segment the images automatically. (2) The parameter settings are studied to ensure that the threshold decay of S-PCNN would be adaptively adjusted according to the overall characteristics of the image. (3) Based on the time series in S-PCNN, a simple selection criteria for the final results is presented to promote efficiency of the proposed method. (4) Simulations are carried out to illustrate the performance of the proposed method. 相似文献

14.

Taylor-AMS features and deep convolutional neural network for converting nonaudible murmur to normal speech

T. Rajesh Kumar G. R Suresh S. Kanaga Subaraja C. Karthikeyan 《Computational Intelligence》2020,36(3):940-963

Communication becomes effective when the speech signal arrives with the profound characteristics. This insisted the researchers to develop an automatic system of recognizing the speech signals from the murmurs. Some of the traditional automatic recognition systems are unfit for the silent environments imposing a need for an effective recognition system. Also, the traditional automatic recognition methods, like Neural Networks, render poor performance in the presence of the murmurs. Thus, this article proposes a method for automatic whisper recognition using the Deep Convolutional Neural Network (DCNN). The training of the DCNN is performed using the proposed Stochastic-Whale Optimization Algorithm (Stochastic-WOA), which is designed by the integration of Stochastic Gradient Descent algorithm with WOA. The input to the classifier is the features that include pitch chroma, spectral centroid, spectral skewness, and Taylor-Amplitude Modulation Spectrogram (Taylor-AMS), which is obtained by combining Taylor series and Amplitude Modulation Spectrogram (AMS) features, of the preprocessed input speech signal. The experimentation of the method is performed using the real database and the analysis proves that the proposed method acquired a maximal accuracy of 0.9723, minimal False Positive Rate of 0.0257, and maximal True Positive Rate of 0.9981, respectively. 相似文献

15.

基于修正PCNN的多传感器图像融合方法 总被引：4，自引：0，他引：4

下载免费PDF全文

李敏蔡骋谈正《中国图象图形学报》2008,13(2):284-290

多传感器图像融合技术作为信息融合的重要分支和研究热点,已广泛应用在机器视觉、医疗诊断、军事遥感等领域。为了更好地进行多传感器图像融合,将在图像分割、目标识别等领域具有独特优势的脉冲耦合神经网络(pulse coupled neural network,PCNN)引入到多传感器图像融合领域中来,提出了一种基于修正PCNN的多源图像融合方法,该方法在区域分割的基础上,先提取区域特征,然后由特征指导融合过程;同时,从目标区域相对于背景的显著性出发,提出了一种反映目标区域突出性的新特征,并针对传统PCNN参数无法自动设定的难题,提出了基于修正PCNN的参数自动设定方案。实验结果表明,该方法无论在主观视觉效果,还是客观评价参数上均优于基于多分辨分析的融合算法,且克服了传统像素级融合方法中融合图像模糊、对噪声敏感等不足,尤其适用于图像不能严格配准的应用场合。这对于拓宽PCNN的理论研究和实际应用具有一定价值。相似文献

16.

基于交叉视觉皮层局部时间序列的图像判别方法

李建锋邹北骥李玲芝辛国江《计算机应用》2011,31(6):1588-1591

脉冲耦合神经网络的时间序列在图像检索和识别中应用广泛,但是时间序列无法体现图像的形状特征,造成图像判别失败。提出交叉视觉皮层的局部时间序列来解决上述问题。首先将图像分块,然后分别提取图像各部分的时间序列,最后将其连接形成整体的时间序列。提出的算法与基本的时间序列及加入边缘信息的时间序列比较,实验证明该方法解决了基本时间序列存在的问题,同时算法效率和准确率更高。相似文献

17.

Evaluation of unsupervised feature extraction neural networks for face recognition

H. M. Ebied K. Revett M. F. Tolba 《Neural computing & applications》2013,22(6):1211-1222

In this paper, new appearances based on neural networks (NN) algorithms are presented for face recognition. Face recognition is subdivided into two main stages: feature extraction and classifier. The suggested NN algorithms are the unsupervised Sanger principal component neural network (Sanger PCNN) and the self-organizing feature map (SOFM), which will be applied for features extraction of the frontal view of a face image. It is of interest to compare the unsupervised network with the traditional Eigenfaces technique. This paper presents an experimental comparison of the statistical Eigenfaces method for feature extraction and the unsupervised neural networks in order to evaluate the classification accuracies as comparison criteria. The classifier is done by the multilayer perceptron (MLP) neural network. Overcoming of the problem of the finite number of training samples per person is discussed. Experimental results are implemented on the Olivetti Research Laboratory database that contains variability in expression, pose, and facial details. The results show that the proposed method SOFM/MLP neural network is more efficient and robust than the Sanger PCNN/MLP and the Eigenfaces/MLP, when used a few number of training samples per person. As a result, it would be more applicable to utilize the SOFM/MLP NN in order to accomplish a higher level of accuracy within a recognition system. 相似文献