共查询到18条相似文献,搜索用时 78 毫秒
1.
在嵌入式系统应用中,如果能够创建仿真环境,并利用仿真环境的优势进行算法的验证、系统的移植、应用程序的设计,就能够极大地提高开发的灵活性,节省开发资源,验证系统的可行性.文巾分析了开放源码的嵌入式系统仿真集成开发环境SkyEye,并实现在该软件平台上基于ARM7TDMI核的AT91EV40仿真开发饭的实时操作系统μC/OS-Ⅱ的移植.把语音识别从试验室推广到实际应用中,在嵌入式系统中进行研究是必然的要求.在该嵌入式软硬什仿真平台上实现说话人识别算法的研究,选取改进了配合于硬件的算法,取得了良好的效果. 相似文献
2.
该文提出了一种新的与文本无关的说话人识别算法。这种算法使用了能处理说话人交叉变量的语音信号频谱变化的模型。使用了两种不同音质的语音,即″纯净音质″和″电话音质″来测试这一算法,得到了很好的实验结果。 相似文献
3.
4.
对HMM算法进行了优化,采用遗传算法与LBG算法相结合的方法生成码本,通过实验验证了优化后算法在文本相关说话人身份认证方面效率有所提高. 相似文献
5.
文本无关的说话人识别:综述 总被引:2,自引:0,他引:2
本文介绍了说话人识别的基本概念和应用前景,分析了说话人识别的技术难点,详细讨论了说话人语音特征的提取方法和说话人识别方法并简要介绍了作者的工作. 相似文献
6.
基于改进VQ算法的文本无关的说话人识别 总被引:3,自引:2,他引:3
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。 相似文献
7.
x-vector系统将一段不定长的语音通过神经网络映射成固定维的矢量来表征说话人信息,该系统在文本无关的说话人确认任务中取得了优异的性能。本文将其应用到文本相关的说话人确认任务中,在x-vector模型选择上,我们采用残差神经网络以获得更有区分性的x-vector;在包含多字符的语句中,对每个字训练一个残差神经网络;在提取过程中,每一个字单独提取一个x-vector并单独进行说话人判决,最后将多个判决得分进行融合后给出最终的识别结果。实验是在数据库RSR2015 Part Ⅲ 上进行的,提出的方法在男性和女性测试集上等错误率分别有相对15.34%、19.7%的下降。 相似文献
8.
不依赖于文本的说话人识别研究及其应用 总被引:4,自引:0,他引:4
说话人识别在自动身份鉴别方面具有重要的现实意义。文章在分析了说话人识别实现的可行性基础上,提出采用长时线性预测倒谱(LPCCEP)系数和矢量量化(VQ)模型的不依赖于文本的说话人识别方法,并成功地应用于一个数据库查询系统中。该方法训练时间短,识别响应实时,数据存储量少。实验表明,在100名说话人集合内,识别率达98%。 相似文献
9.
10.
11.
A growing body of recent work documents the potential benefits of sub-band processing over wideband processing in automatic speech recognition and, less usually, speaker recognition. It is often found that the sub-band approach delivers performance improvements (especially in the presence of noise), but not always so. This raises the question of precisely when and how sub-band processing might be advantageous, which is difficult to answer because there is as yet only a rudimentary theoretical framework guiding this work. We describe a simple sub-band speaker recognition system designed to facilitate experimentation aimed at increasing understanding of the approach. This splits the time-domain speech signal into 16 sub-bands using a bank of second-order filters spaced on the psychophysical mel scale. Each sub-band has its own separate cepstral-based recognition system, the outputs of which are combined using the sum rule to produce a final decision. We find that sub-band processing leads to worthwhile reductions in both the verification and identification error rates relative to the wideband system, decreasing the identification error rate from 3.33% to 0.56% and equal error rate for verification by approximately 50% for clean speech. The hypothesis is advanced that, unlike the wideband system, sub-band processing effectively constrains the free parameters of the speaker models to be more uniformly deployed across frequency: as such, it offers a practical solution to the bias/variance dilemma of data modeling. Much remains to be done to explore fully the new paradigm of sub-band processing. Accordingly, several avenues for future work are identified. In particular, we aim to explore the hypothesis of a practical solution to the bias/variance dilemma in more depth. 相似文献
12.
论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,在原始语音具有较高信噪比(≥10dB)的情况下,能够切除某些短时噪声和白噪声犤2犦。 相似文献
13.
语音识别中的一种说话人聚类算法 总被引:1,自引:1,他引:1
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。 相似文献
14.
15.
16.
研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。 相似文献
17.
该文介绍了一种基于矢量量化(VQ)方法的一个说话人识别算法。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。用不同语音参数进行实验,实验表明应用矢量量化的方法用在说话人识别中是一种有效方法。 相似文献