首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率.  相似文献   

2.
语音识别中的一种说话人聚类算法   总被引:1,自引:1,他引:1  
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。  相似文献   

3.
现有基于混合高斯模型的说话人聚类方法主要依据最大后验准则,从通用背景模型中自适应得到类别的混合高斯模型,然而自适应数据较少,模型的准确性不够。对此,文中尝试基于本征语音(EV)空间和全变化(TV)空间分析的两种因子分析建模方法,通过对差异空间的建模,减少估计类别混合高斯模型时需要估计的参数个数。结果表明,在美国国家标准技术研究所2008年说话人识别评测的电话语音数据集上,相对于基于最大后验概率准则的基线系统而言,文中所使用的基于EV和TV空间分析的建模方法都可使聚类错误率有较大幅度的下降,并且TV空间分析建模相对于EV空间分析建模能获得更低的聚类错误率。  相似文献   

4.
为了提高说话人识别系统的识别效率,提出一种基于说话人模型聚类的说话人识别方法,通过近似KL距离将相似的说话人模型聚类,为每类确定类中心和类代表,构成分级说话人识别模型。测试时先通过计算测试矢量与类中心或类代表之间的距离选择类,再通过计算测试矢量与选中类中的说话人模型之间对数似然度确定目标说话人,这样可以大大减少计算量。实验结果显示,在相同条件下,基于说话人模型聚类的说话人识别的识别速度要比传统的GMM的识别速度快4倍,但是识别正确率只降低了0.95%。因此,与传统GMM相比,基于说话人模型聚类的说话人识别能在保证识别正确率的同时大大提高识别速度。  相似文献   

5.
基于高斯混合模型(GaussianMixtureModel,M)间差别的方法是进行说话人聚类的常用的一类方法。该文GM提出两种新颖的GMM差别度量,“类散度”和GMM的相互概率。“类散度”即模型间“离散度”与模型内“离散度”之比,在计算中综合考虑了GMM各个胞腔的权值、均值及方差的影响,全面地反映了高斯混合模型参数的差别。GMM的相互概率即其中一个GMM的参数在另一个GMM下的概率。实验证明,两种方法均能很好地描述GMM间的差别,在说话人聚类实验中表现良好。  相似文献   

6.
目前说话人聚类时将说话人分割后的语音段作为初始类,直接对这些数量庞大语音段进行聚类的计算量非常大。为了降低说话人聚类时的计算量,提出一种面向说话人聚类的初始类生成方法。提取说话人分割后语音段的特征参数及特征参数的质心,结合层次聚类法和贝叶斯信息准则,对语音段进行具有宽松停止准则的“预聚类”,生成初始类。与直接对说话人分割后的语音段进行聚类的方法相比,该方法能在保持原有聚类性能的情况下,减少40.04%的计算时间;在允许聚类性能略有下降的情形下,减少60.03%以上的计算时间。  相似文献   

7.
基于说话人聚类和支持向量机的说话人确认研究   总被引:3,自引:1,他引:3  
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选取或选取与目标说话人相近的说话人。采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据。实验表明该方法对与文本无关的说话人确认问题是有效的。  相似文献   

8.
基于说话人聚类和支持向量的说话人确认研究   总被引:2,自引:0,他引:2  
侯风雷 《计算机应用》2002,22(10):33-35
说话人确认系统需要用目标说话人和背景模型说话人的语音数据对模型进行训练。背景模型说话人可随机选或选取与目标说话人相近的说话人,采用说话人聚类的方法可以有效地解决说话人背景模型的选取问题。支持向量机用作说话人确认模型来训练目标说话人和背景说话人的语音数据,实验表明该方法地与文本无关的说话人确认问题是有效的。  相似文献   

9.
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。  相似文献   

10.
11.
12.
独立分量分析0CA)基于信号的高阶统计量,能从混合信号中分离出既具有统计独立性又具有非高斯性的源信号,在诸多ICA算法中,固定点算法(也称FastICA)以其收敛速度快、分离效果好被广泛应用于信号处理领域。在介绍ICA的基本模型与FastICA算法的原理后,分别对混合的语音信号与图像信号进行了分离实验,仿真结果表明FastICA应用于语音分离与图像分离,效果都很好。  相似文献   

13.
基于模糊聚类神经网络的语音识别方法   总被引:8,自引:0,他引:8  
刘宇红  刘桥  任强 《计算机学报》2006,29(10):1894-1900
提出了一种基于模糊神经网络的语音识别方法.该方法以模糊系统模型为基础,利用改进的模糊聚类辨识算法,构成一种新型的模糊聚类神经网络(FCNN),并将其作为概率密度函数的估计器,对每个状态的输出进行预测.它不仅能有效地在语音识别中引入帧间相关信息,而且能克服状态输出概率密度函数为混合高斯分布的束缚.通过对非特定人汉语孤立词和连续音节的语音识别实验,证实了该方法的有效性.  相似文献   

14.
基于深度学习的单声道语音分离需要计算时频掩蔽,但现有语音分离方法中时频掩蔽不可学习,也未将其封装到深度学习中进行优化,通常依赖于维纳滤波法进行后续处理。为此,提出一种基于生成对抗网络的语音信号分离方法。在语音生成阶段引入递归推导算法和稀疏编码器来改进时频掩蔽生成结果,并将生成的语音输入至判别器进行分类,以降低信号源之间的扰动。实验结果表明,与基于深度神经网络的语音信号分离方法相比,该方法的SDR、SIR分离指标分别提高6.2 dB和5.0 dB。  相似文献   

15.
王珊  许刚 《计算机工程》2007,33(18):211-213
基于计算听觉场景原理,提出了一种混叠语音信号分离算法模型,对两个说话者的混叠声音进行分离。该模型对低频区和高频区的分离分别采用了不同方法,避免了因采用同样方法处理低频高频区而导致对高频段语音不能很好分离的结果。实验结果表明,该模型具有很好的应用效果。  相似文献   

16.
提出基于深层声学特征的端到端单声道语音分离算法,传统声学特征提取方法需要经过傅里叶变换、离散余弦变换等操作,会造成语音能量损失以及长时间延迟.为了改善这些问题,提出了以语音信号的原始波形作为深度神经网络的输入,通过网络模型来学习语音信号的更深层次的声学特征,实现端到端的语音分离.客观评价实验说明,本文提出的分离算法不仅有效地提升了语音分离的性能,也减少了语音分离算法的时间延迟.  相似文献   

17.
通过使用多波束形成器对盲分离系统进行预处理滤波,结合频域内独立分量分析的方法,提出了一种基于麦克阵列的快速实时盲语音分离系统,它能够有效地分离在真实环境中的卷积混叠语音信号。  相似文献   

18.
研究语音信号盲分离的实时算法.盲信号分离技术在视频会议系统、语音信号预处理以及生物医学信号处理中都得到广泛应用.在本文中,利用最小二乘方原理并结合语音信号非平稳的特点,对混合语音信号进行实时分离.实验结果表明,基于最小二乘方的算法是非常有效的实时盲信号分离算法.  相似文献   

19.
基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号