共查询到15条相似文献,搜索用时 156 毫秒
1.
在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,以降低基音频率对其的影响。 相似文献
2.
提出了基于TMS320VC5409的嵌入式说话人识别系统方案。整个系统以TMS320VC5409DSP芯片和EPM3256AQC208CPLD芯片为核心进行设计,完成了对说话人语音信号的采集、说话人识别核心算法的实现、输出结果显示以及外围设备的控制等功能,系统的核心算法采用了Mel频率倒谱系数(MFCC)作为特征参数进行提取和矢量量化(VQ)进行模式匹配。该系统具有良好的灵活性、实时性和准确性,在抗噪性、鲁棒性和识别率等方面也有显著提高,可以作为一个子系统在诸多领域应用。 相似文献
3.
人工神经网络通过学习可以实现对输入向量的分类,也就是说,对于经过训练的神经网络,每输入一个矢量,人工神经网络输出一个该矢量所属类别的标号,神经网络的这种分类作用可以运用到说话人识别中.本文在介绍人工神经网络实现对输入向量分类原理的基础上,通过MATLAB实现了基于神经网络学习向量量化方法(LVQ)的说话人识别实验,取得了较为满意的结果. 相似文献
4.
为了研究"世界记忆遗产"东巴经典古籍的音频分类,以通过语音情感特征提取的方法分类鉴别东巴音频类别,并实现对东巴经典语音的情感状态识别,同时提高人机交互性能,提出采用Mel频率倒谱系数(MFCC)实现语音情感特征的提取。通过引入MFCC的一阶差分、二阶差分描述语音特征的动态特征,并整合短时能量特征,最终形成MFCC和短时能量相叠加的语音信号特征参数,达到提取反映语音情感特征的目的。实验验证表明,该语音信号特征提取方法能够更明显地区分出包含在语音中的情感信息,为语音情感特征的识别研究及东巴古籍音频分类鉴别提供理论基础。 相似文献
5.
基于概率神经网络说话人识别的算法研究 总被引:1,自引:0,他引:1
为实现由语音信号进行说话人身份的辨识,研究了以往的实现说话人辨认的系统,提出一种改进的算法,采用能够反映人对语音感知特性的Mel频率倒谱系数(MFCC)作为特征参数,即基于概率神经网络(PNN)的识别方法。经实测数据的处理,表明PNN对训练样本有很高的分类准确率,且对测试样本的分类准确性也较高,并验证了本方法的有效性。 相似文献
6.
门控系统在当今社会各个领域应用相当广泛,如何增强系统的安全性与操作的方便性成为大家关注的热点之一。应用单片机与说话人识别技术设计了智能门控系统。该系统主要通过语音实现用户身份的认证。并触发门锁控制电机工作。此外,系统还配备有超级用户密码功能。用以解决特殊情况下系统无法听从语音控制的现象。试验结果表明,该系统不仅使用方便,而且拥有较高的识别精度和响应速度。具有一定的应用和推广价值。 相似文献
7.
8.
生物特征识别技术相对于传统密码等方式具有更高的可靠性,而作为生物特征识别技术的重要研究方向之一的声纹识别方法,研究更精确的声纹识别方法具有更高的研究意义。随着深度学习的发展,深度学习应用在声纹识别技术上成为在声纹识别领域研究的重点。提出一种基于深度神经网络和beyond triplet loss相结合的说话人识别方法,模型通过梅尔频率倒谱系数(MFCC)提取MFCC声学特征,对MFCC声学特征提取说话人声纹特征,然后进行多元损失的模型训练。实验结果表明,DNN-BTL算法在说话人识别领域比高斯混合-隐马尔可夫模型(GMM-HMM)具有更好的识别效果。 相似文献
9.
针对无线网络中ARQ协议的传输能耗,建立了每比特有效数据的等效能耗数学模型和设定了以链路最低能耗为能量有效性的优化目标。并依据传输能耗的研究结论将数据链路层的子包传输机制与物理层的自适应调制编码技术(AMC)相结合,提出了一种基于能量有效性的吞吐量跨层控制协议。该协议以最大化系统吞吐量为目的,并实现了AMC和子包机制的能量有效性控制。仿真结果显示该协议可以使系统吞吐量的性能达到整体最佳和使数据传输能耗达到能量有效性的目标。 相似文献
10.
11.
简要介绍了说话人识别的概念及人工神经网络的有关理论。以BP网络为例阐述了人工神经网络在说话者识别中的应用。实验证明,该方法不仅识别性能较好、操作方便,在身份认证领域是一种很具有吸引力和发展前途的新方法。 相似文献
12.
说话人识别是以话音对说话人进行区分,从而进行身份鉴别与认证的技术.介绍了在工厂自动控制系统中说话人识别技术的应用,包含其原理、所采用的识别方法及其系统实现. 相似文献
13.
14.
Speech recognition is a hot topic in the field of artificial intelligence. Generally, speech recognition models can only run on large servers or dedicated chips. This paper presents a keyword speech recognition system based on a neural network and a conventional STM32 chip. To address the limited Flash and ROM resources on the STM32 MCU chip, the deployment of the speech recognition model is optimized to meet the requirements of keyword recognition. Firstly, the audio information obtained through sensors is subjected to MFCC (Mel Fre-quency Cepstral Coefficient) feature extraction, and the extracted MFCC features are input into a CNN (Convolutional Neural Network) for deep feature extraction. Then, the features are input into a fully connected layer, and finally, the speech keyword is classified and predicted. Deploying the model to the STM32F429, the prediction model achieves an accuracy of 90.58%, a decrease of less than 1% compared to the accuracy of 91.49% running on a computer, with good performance. 相似文献
15.
基于仿生模式识别的地面声目标识别方法 总被引:2,自引:0,他引:2
利用地面目标的声信号实现目标类型的识别是当前传感器应用领域的研究热点,大量研究集中于提高目标的正确识别率,而关于实用系统中更为关键的目标误识率的实验结果却很少。针对这一问题,本文提出了一种新的基于仿生模式识别的地面声目标识别算法,详细描述了其原理及基于二权值神经元网络的实现算法,并利用实测数据集将其识别效果与现有识别方法(GMM,神经网络)进行了比较分析。实验结果表明,仿生模式识别方法能够有效克服现有识别系统中,误识率高、低训练样本数量情况下识别率低、系统需重复训练等缺点,具有更好的应用前景。 相似文献