首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
在嵌入式系统应用中,如果能够创建仿真环境,并利用仿真环境的优势进行算法的验证、系统的移植、应用程序的设计,就能够极大地提高开发的灵活性,节省开发资源,验证系统的可行性.文巾分析了开放源码的嵌入式系统仿真集成开发环境SkyEye,并实现在该软件平台上基于ARM7TDMI核的AT91EV40仿真开发饭的实时操作系统μC/OS-Ⅱ的移植.把语音识别从试验室推广到实际应用中,在嵌入式系统中进行研究是必然的要求.在该嵌入式软硬什仿真平台上实现说话人识别算法的研究,选取改进了配合于硬件的算法,取得了良好的效果.  相似文献   

2.
该文提出了一种新的与文本无关的说话人识别算法。这种算法使用了能处理说话人交叉变量的语音信号频谱变化的模型。使用了两种不同音质的语音,即″纯净音质″和″电话音质″来测试这一算法,得到了很好的实验结果。  相似文献   

3.
说话人识别 ,是指通过说话人的语音来自动识别说话人的身份 ,它主要包括特征提取和模式匹配两个部分。随着计算机技术和人工智能的发展 ,通过说话人识别实现特定场合的实体鉴别已经具有非常重要的研究和应用价值。  相似文献   

4.
对HMM算法进行了优化,采用遗传算法与LBG算法相结合的方法生成码本,通过实验验证了优化后算法在文本相关说话人身份认证方面效率有所提高.  相似文献   

5.
文本无关的说话人识别:综述   总被引:2,自引:0,他引:2  
本文介绍了说话人识别的基本概念和应用前景,分析了说话人识别的技术难点,详细讨论了说话人语音特征的提取方法和说话人识别方法并简要介绍了作者的工作.  相似文献   

6.
基于改进VQ算法的文本无关的说话人识别   总被引:3,自引:2,他引:3  
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。  相似文献   

7.
x-vector系统将一段不定长的语音通过神经网络映射成固定维的矢量来表征说话人信息,该系统在文本无关的说话人确认任务中取得了优异的性能。本文将其应用到文本相关的说话人确认任务中,在x-vector模型选择上,我们采用残差神经网络以获得更有区分性的x-vector;在包含多字符的语句中,对每个字训练一个残差神经网络;在提取过程中,每一个字单独提取一个x-vector并单独进行说话人判决,最后将多个判决得分进行融合后给出最终的识别结果。实验是在数据库RSR2015 Part Ⅲ 上进行的,提出的方法在男性和女性测试集上等错误率分别有相对15.34%、19.7%的下降。  相似文献   

8.
不依赖于文本的说话人识别研究及其应用   总被引:4,自引:0,他引:4  
说话人识别在自动身份鉴别方面具有重要的现实意义。文章在分析了说话人识别实现的可行性基础上,提出采用长时线性预测倒谱(LPCCEP)系数和矢量量化(VQ)模型的不依赖于文本的说话人识别方法,并成功地应用于一个数据库查询系统中。该方法训练时间短,识别响应实时,数据存储量少。实验表明,在100名说话人集合内,识别率达98%。  相似文献   

9.
万洪杰  杜利民  邓浩江 《计算机应用》2005,25(6):1334-1335,1338
基于贝叶斯网络基础理论,并针对与文本无关说话人识别任务,构造了一种用于说话人识别的贝叶斯网络结构,给出了该网络模型的构造和参数估计方法,提出了进行说话人识别时进行推理和分类预测的算法。通过与传统的混合高斯模型(GMM)的实验类比,该贝叶斯网络模型能够在同样的训练和测试数据情况下识别率平均相对提高30%。  相似文献   

10.
说话人识别综述   总被引:1,自引:0,他引:1  
在分析说话人识别原理的基础上,分别从说话人识别的特征提取、说话人模型等方面进行了综述,并讨论了说话人识别的优点和不足,展望了其应用研究的前景。  相似文献   

11.
A growing body of recent work documents the potential benefits of sub-band processing over wideband processing in automatic speech recognition and, less usually, speaker recognition. It is often found that the sub-band approach delivers performance improvements (especially in the presence of noise), but not always so. This raises the question of precisely when and how sub-band processing might be advantageous, which is difficult to answer because there is as yet only a rudimentary theoretical framework guiding this work. We describe a simple sub-band speaker recognition system designed to facilitate experimentation aimed at increasing understanding of the approach. This splits the time-domain speech signal into 16 sub-bands using a bank of second-order filters spaced on the psychophysical mel scale. Each sub-band has its own separate cepstral-based recognition system, the outputs of which are combined using the sum rule to produce a final decision. We find that sub-band processing leads to worthwhile reductions in both the verification and identification error rates relative to the wideband system, decreasing the identification error rate from 3.33% to 0.56% and equal error rate for verification by approximately 50% for clean speech. The hypothesis is advanced that, unlike the wideband system, sub-band processing effectively constrains the free parameters of the speaker models to be more uniformly deployed across frequency: as such, it offers a practical solution to the bias/variance dilemma of data modeling. Much remains to be done to explore fully the new paradigm of sub-band processing. Accordingly, several avenues for future work are identified. In particular, we aim to explore the hypothesis of a practical solution to the bias/variance dilemma in more depth.  相似文献   

12.
论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,在原始语音具有较高信噪比(≥10dB)的情况下,能够切除某些短时噪声和白噪声犤2犦。  相似文献   

13.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

14.
VoIP压缩码流说话人识别研究   总被引:1,自引:0,他引:1  
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。  相似文献   

15.
嵌入式语音识别系统的研究和实现   总被引:9,自引:1,他引:9  
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难,并指出了今后相关的研究方向。  相似文献   

16.
研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。  相似文献   

17.
该文介绍了一种基于矢量量化(VQ)方法的一个说话人识别算法。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。用不同语音参数进行实验,实验表明应用矢量量化的方法用在说话人识别中是一种有效方法。  相似文献   

18.
针对MFCC不能得到高效的说话人识别性能的问题,提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布,然后将时频域转换到频域再提取MFCC+MFCC作为特征参数,最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能,结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号