首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
何伟  徐阳  张玲 《计算机应用》2012,32(5):1463-1466
利用可编程片上系统(SOPC)灵活的可编程性和现场可编程门阵列(FPGA)强大的并行处理能力,在FPGA上实现说话人识别算法,并从识别速度和识别精度两个方面对系统进行优化。研究了说话人识别算法的原理,针对其特点构建了SOPC系统,用乒乓操作实现语音采集和处理,利用FPGA的硬件实现算法中较为耗时的模块,提高了识别速度,同时又利用遗传算法来生成模板码书,提高了识别精度。最终,实现对说话人身份进行识别的功能,系统具有较高的实时性和识别精度。  相似文献   

2.
说话人身份识别系统的设计与实现   总被引:1,自引:0,他引:1  
黄金明 《计算机工程》2004,30(Z1):365-366
说话人身份识别是生物识别技术的一种,属于模式识别的范畴。说话人识别的目的是根据语音信息识别说话人身份。从技术上主要 是从说话人语音信息中提取反映说话人的生理和行为特征的语音参数,并根据这些语音参数自动识别说话人的身份。该文分析了常见的说话 人识别方法,并以此为基础实现了一种说话人身份识别系统设计。  相似文献   

3.
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP(Back-propagation Neural Network)是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。  相似文献   

4.
目前,基于PC或DSP的系统其处理能力无法满足海量语音信号高速处理需求的增长。本文分析了VQ(矢量量化)搜索算法的硬件实现复杂度,针对说话人识别过程中运算量最大、耗时最长的判决过程,提出了一种基于标签的说话人判决模型实现方案。该设计用FPGA实现,可对多路电话信道说话人进行实时判决识别。  相似文献   

5.
基于DSP的声控系统的设计与实现   总被引:3,自引:0,他引:3  
介绍了一个包括说话人识别和说话内容识别的声控系统的设计与实现.该系统以TMS320VC5509 DSP为平台,以倒谱系数为特征参数,以欧氏距离法和矢量量化法为识别算法,实时实现了系统的识别功能.  相似文献   

6.
现代通信中,说话人的身份认证技术一直是通信行业研究的重点和热点。而基于GMM和MFCC的说话人识别技术,是目前为止相对成熟和常用的方法。对说话人识别系统的构成做了相关的研究,并通过MATLAB编程,设计了一款以MFCC作为特征参数,基于GMM模型的说话人识别系统。经过实验测试,本系统能基本满足工作及家庭生活环境下的说话人识别需要。  相似文献   

7.
i-vector是反映说话人声学差异的一种重要特征,在目前的说话人识别和说话人验证中显示了有效性。将i-vector应用于语音识别中的说话人的声学特征归一化,对训练数据提取i-vector并利用LBG算法进行无监督聚类.然后对各类分别训练最大似然线性变换并使用说话人自适应训练来实现说话人的归一化。将变换后的特征用于训练和识别.实验表明该方法能够提高语音识别的性能。  相似文献   

8.
为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。  相似文献   

9.
不依赖于文本的说话人识别研究及其应用   总被引:4,自引:0,他引:4  
说话人识别在自动身份鉴别方面具有重要的现实意义。文章在分析了说话人识别实现的可行性基础上,提出采用长时线性预测倒谱(LPCCEP)系数和矢量量化(VQ)模型的不依赖于文本的说话人识别方法,并成功地应用于一个数据库查询系统中。该方法训练时间短,识别响应实时,数据存储量少。实验表明,在100名说话人集合内,识别率达98%。  相似文献   

10.
在噪声环境中如何提高说话人识别精度是说话人识别研究中的一个非常重要的课题。为了让说话人识别系统在安静的环境和噪声环境中都能取得满意的工作性能,研究一个将语音增强器与说话人识别器级连起来的系统。该系统中,采用Weiner滤波增强算法提高说话人识别系统前端预处理的抗噪声能力,提高输入信号的信噪比。实验测试结果表明,该系统具有很好的抗噪声性能。  相似文献   

11.
为探究对抗样本对端到端说话人辨认系统的安全威胁与攻击效果,比较现有对抗样本生成算法在语音环境下的性能优劣势,分析FGSM、JSMA、BIM、C&W、PGD 5种白盒算法和ZOO、HSJA 2种黑盒算法。将7种对抗样本生成算法在ResCNN和GRU两种网络结构的端到端说话人辨认模型中实现有目标和无目标攻击,并制作音频对抗样本,通过攻击成功率和信噪比等性能指标评估攻击效果并进行人工隐蔽性测试。实验结果表明,现有对抗样本生成算法可在端到端说话人辨认模型中进行实现,白盒算法中的BIM、PGD具有较好的性能表现,黑盒算法的无目标攻击能达到白盒算法的攻击效果,但其有目标攻击性能有待进一步提升。  相似文献   

12.
通过分析GMM(高斯混合模型)的说话人辨认系统的性能,提出了一种捕捉不同说话人交互信息的人工神经网络(ANN)方法,构成一个GMM/ANN混合说话人辨认系统。实验表明,GMM/ANN混合系统的说话人辨认能够取得比基于GMM和基于MLP(多层感知器)更高的辨认率。  相似文献   

13.
A novel approach for joint speaker identification and speech recognition is presented in this article. Unsupervised speaker tracking and automatic adaptation of the human-computer interface is achieved by the interaction of speaker identification, speech recognition and speaker adaptation for a limited number of recurring users. Together with a technique for efficient information retrieval a compact modeling of speech and speaker characteristics is presented. Applying speaker specific profiles allows speech recognition to take individual speech characteristics into consideration to achieve higher recognition rates. Speaker profiles are initialized and continuously adapted by a balanced strategy of short-term and long-term speaker adaptation combined with robust speaker identification. Different users can be tracked by the resulting self-learning speech controlled system. Only a very short enrollment of each speaker is required. Subsequent utterances are used for unsupervised adaptation resulting in continuously improved speech recognition rates. Additionally, the detection of unknown speakers is examined under the objective to avoid the requirement to train new speaker profiles explicitly. The speech controlled system presented here is suitable for in-car applications, e.g. speech controlled navigation, hands-free telephony or infotainment systems, on embedded devices. Results are presented for a subset of the SPEECON database. The results validate the benefit of the speaker adaptation scheme and the unified modeling in terms of speaker identification and speech recognition rates.  相似文献   

14.
基于高斯混合模型的说话人确认系统   总被引:4,自引:1,他引:4  
杨澄宇  赵文  杨鉴 《计算机应用》2001,21(4):7-8,11
由于在人的话音频谱中,低频和较高频段含有较多说话人的个性信息,本文提出一种LPC倒谱的改进算法用于与文本无关的说话人识别,该改进算法通过话音频谱的各频段进行加权,突出说话人的个性信息,从而使说话人更易于区分。  相似文献   

15.
Little is known about the perceptual processes of speaker identification and their relationship to the acoustic features of the speaker's voice. A study of speaker perception and identification by psychoacoustic experiments was carried out. Twenty male speakers were recorded and thirty listeners participated in the experiments. Statistical analysis of the results suggests that the prototype model is appropriate for explaining the process of speaker identification. The most important features for speaker identification were the fundamental frequency, the third and fourth formants, and the closing phase of the glottal wave. For different listeners, different sets of features were found to be significant for coding speaker identity.  相似文献   

16.
在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,有效地提高了系统性能。在NIST’03 1spk数据库上的说话人辨识实验表明了评分规整技术对说话人辨识的有效性。  相似文献   

17.
王成儒  王金甲 《计算机工程》2003,29(13):105-106,114
提出了一种基于最小分类错误准则的概率神经网络的训练算法。实验结果表明,该系统及其MCE学习算法在20个说话人辨认应用中利用5s清晰语音获得98.9%的辨认率,利用l5s电话语音获得86.2%的辨认率。  相似文献   

18.
本文提出了一种基于语音分段辨认序列信息的与文本无关的说话人确认方法,并且着重分析了其中关键因素的变化,包括聚类数、阈值以及判定准则的变化,对确认效果的影响。通过实验证明了分段辨认序列频度信息是一种非常有效的说话人确认信息,对于确认结果起到很好的辅助作用。同时也指出了新方法的不足和今后的改进方向。  相似文献   

19.
线性预测系数倒谱(LPCC)是说话人辨认系统中较为有效的特征参数之一,但是该参数的抗噪性能不好,当语音中含有噪声时,系统的识别率明显下降。基于MATLAB软件,建立了一高斯混合模型(GMM)的说话人辨认系统,提出了特征参数加权窗口的方法。通过对多种加权窗口的正确识别率比较,发现对LPCC低阶参数的加窗提升,可以改善系统的噪声鲁棒性。MATLAB仿真结果显示,采用加窗后的系统识别率得到了明显改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号