首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 812 毫秒
1.
采用模糊C-均值聚类算法(FCM)实现声纹码本的矢量量化,使用基于相似系数和的孤立点检测法识别孤立点.试验表明,该方法能有效地减少孤立点对识别结果的干扰,显著降低码本量化误差,从而提高矢量量化声纹识别系统的识别率.  相似文献   

2.
本文论述的是一种高质量、中低速码率的语音矢量量化编码.为了提高综合语音质量,在提取声道参数中采用了 Itakura-Saito 失真测试,并用高维残差矢量激励源.经过计算机模拟证明我们在训练码本时采用的一些方法是行之有效的.  相似文献   

3.
论述了一种高质量、低速率的语音编码矢量量化方法。在提取声道参数中采用了增益归一化模型谱失真测度[2]。计算机模拟结果表明,本文在训练码本时采用的方法是行之有效的。  相似文献   

4.
矢量量化是一种极其重要的数据压缩方法 ,但其码本设计算法容易陷入局部极小值 .为了解决这个问题 ,可以将模拟退火法引入矢量量化器的码本设计  相似文献   

5.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

6.
为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法(F-LBG:Fuzzy-LBG);采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。  相似文献   

7.
一种高效、低存储的线谱频率参数矢量量化器   总被引:2,自引:1,他引:1  
为了降低线谱频率(LSF)参数矢量量化器的搜索复杂度和码字存储单元,利用LSF参数的帧内和帧间相关性,设计了一种LSF参数的预测式多级分裂矢量量化器.该量化器对LSF参数的预测残差矢量进行两级矢量量化,其中第2级的误差矢量分裂成2个维数分别为4和6的子矢量进行矢量量化,采用瞬时联合多级矢量量化器设计算法设计码本,应用M-L树搜索算法搜索码字,降低了搜索复杂度和码字存储单元,在20 bit时,平均谱失真小于1 dB.  相似文献   

8.
矢量量化是一种极其重要的数据压缩方法,但其码本设计算法容易陷入局部极小值。为了解决这个问题,可以将模拟退火引入磁量量化器的码本设计。  相似文献   

9.
为了提高自适应后向码本的精度,提出了一种码本更新的新算法.该算法设置了一个线谱频率系数自适应后向码本,通过对该码本中最新一个码矢量与当前帧线谱频率系数内插来提高线性预测系数自适应后向码本的精度,从而提高了后向量化的使用率,降低了平均编码速率.主客观测试表明,改进算法的合成语音质量好于自适应前后向量化IMBE算法,且合成语音质量与 2.4kb/s IMBE算法相当.  相似文献   

10.
矢量量化作为一种有效的图像数据压缩技术,越来越受到人们的重视,但研究表明:上前矢量量化技术存在的主要问题之一是图像边缘失真严重。本文了一种神经网络的图像边缘保持持矢量量化方法,它以Kohonen的自组织特征映射算法(SOFM)为基础,根据人的视觉系统对图像边缘的敏感性,在图像编码前,先对整幅图像的边缘提取,再将每一图像子块的边缘特性用一”活跃因子“表示。在矢量量化过程中,根据不同训练矢量的活跃因子  相似文献   

11.
不定人语音识别系统   总被引:1,自引:0,他引:1  
采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型DHMM孤立字语音识别系统中,采用了3种说话人自适应方法,方法1,方法2为码本自适应,方法3为新人数据自适应,并将新建的1000人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高16%,达到93%以上;在数据库的采用,使得不定人的数字识别率达到  相似文献   

12.
真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个长的音频流,以一个固定粒度对其随机乱序,然后将其切割,并通过多次重采样操作来增加支持向量机(SVM)的训练样本数。实验基于一个从访谈节目中录制的真实语音情感库。实验结果表明,在统一背景模型-高斯混合模型-支持向量机(UBM—GMM—SVM)识别框架中这种训练集重构的方法错误率降低近33.10%。  相似文献   

13.
提出一种基于粒子群优化算法的图像矢量量化码书设计算法.该算法引入粒子群的全局搜索策略,结合矢量量化码书设计方法,增加了算法解的随机性和多样性.实验结果显示,本算法与传统LBG码书设计算法相比,具有更强的鲁棒性,可有效解决LBG算法对初始码书的依赖性,能获得性能较好的码书.  相似文献   

14.
本文提出一种用隐马氏链模型识别汉语声调的新方案。由每一种声调的训练语音求出相应的概率模型参数作为识别模板。识别时,分别用每一种声调的模型参数计算出现输入语声周期序列的概率,概率最大者即为输入语声的声调模型。实验语音选用的是“小学汉语拼音教学录音磁带”,一个男声和一个女声,对于其中的24个韵母和21组拼音音节,正确识别率为98%。  相似文献   

15.
新的学习矢量量化初始码书算法   总被引:1,自引:0,他引:1  
针对原有随机数设置法、训练矢量集随机抽取法和LGB分裂法等初始码书算法存在的码矢利用率较低、运算量大和与信源匹配程度不高等不足,提出了一种新的分离平均法,并应用到基于自组织特征映射算法(SOM)的学习矢量量化(LVQ)中,图像矢量量化的实验表明,分离平均初始码书算法具有无效码矢数量少、码书性能高、运算量小、实现简单等优点。  相似文献   

16.
介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能.  相似文献   

17.
与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进,并基于改进算法进行了与文本无关的说话人识别。经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率。  相似文献   

18.
本文介绍的计算机语声命令输入系统能够通过话筒直接输入语声命令,同时也可用键盘进行操作.系统采用经过实时优化的连续矢量量化聚(CVQC)算法,可在以 TMS32010为主体的高速信号处理板(UDSP-10)上实时进行语声命令的训练和识别。识别响应时间小于20ms.本文详细讨论了系统的硬件结构,识别算法和系统接口软件。最后给出了系统识别率指标。  相似文献   

19.
针对现有关键词识别系统采用很难用硬件电路准确描述的连续隐马尔可夫模型CHMM作为识别模型,提出用离散隐马尔可夫模型DHMM作为系统的识别模型,研究了适用于硬件实现的状态机端点检测算法,并通过引入VQ矢量量化模块来保证离散关键词识别系统的识别率和识别速度;根据关键词训练模型,分析所采集语音信息中是否存在指定的关键词并进行准确识别。实验结果表明,该算法在便于硬件实现的基础上,具有良好的识别率和实时性,为关键词识别系统的FPGA硬件电路实现研究提供了参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号