期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能. 相似文献

6.

语音模糊特征提取及码本训练算法

姜占才杨林《长春邮电学院学报》2012,(3):279-284

为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法（F-LBG：Fuzzy-LBG）;采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。相似文献

7.

一种高效、低存储的线谱频率参数矢量量化器 总被引：2，自引：1，他引：1

李靓鲍长春白燕宁《北京工业大学学报》2005,31(2):130-135

为了降低线谱频率(LSF)参数矢量量化器的搜索复杂度和码字存储单元,利用LSF参数的帧内和帧间相关性,设计了一种LSF参数的预测式多级分裂矢量量化器.该量化器对LSF参数的预测残差矢量进行两级矢量量化,其中第2级的误差矢量分裂成2个维数分别为4和6的子矢量进行矢量量化,采用瞬时联合多级矢量量化器设计算法设计码本,应用M-L树搜索算法搜索码字,降低了搜索复杂度和码字存储单元,在20 bit时,平均谱失真小于1 dB. 相似文献

8.

用模拟退火法解决LBG算法陷入局部极小的问题

任国燕《重庆工业高等专科学校学报》2001,16(2):54-56

矢量量化是一种极其重要的数据压缩方法,但其码本设计算法容易陷入局部极小值。为了解决这个问题,可以将模拟退火引入磁量量化器的码本设计。相似文献

9.

一种改进型自适应前后向量化IMBE算法

李烨杨家玮梁彦霞《西安电子科技大学学报(自然科学版)》2009,36(6):968-971+984

为了提高自适应后向码本的精度,提出了一种码本更新的新算法．该算法设置了一个线谱频率系数自适应后向码本,通过对该码本中最新一个码矢量与当前帧线谱频率系数内插来提高线性预测系数自适应后向码本的精度,从而提高了后向量化的使用率,降低了平均编码速率．主客观测试表明,改进算法的合成语音质量好于自适应前后向量化IMBE算法,且合成语音质量与 2.4kb/s IMBE算法相当．相似文献

10.

图像边缘保持矢量量化及神经网络的实现

李志能《浙江大学学报(工学版)》1999,33(1):68-73

矢量量化作为一种有效的图像数据压缩技术,越来越受到人们的重视,但研究表明：上前矢量量化技术存在的主要问题之一是图像边缘失真严重。本文了一种神经网络的图像边缘保持持矢量量化方法,它以Ｋｏｈｏｎｅｎ的自组织特征映射算法（ＳＯＦＭ）为基础,根据人的视觉系统对图像边缘的敏感性,在图像编码前,先对整幅图像的边缘提取,再将每一图像子块的边缘特性用一”活跃因子“表示。在矢量量化过程中,根据不同训练矢量的活跃因子相似文献

11.

不定人语音识别系统 总被引：1，自引：0，他引：1

胡春静吴善培《北京邮电大学学报》1995,18(1):25-30

采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型ＤＨＭＭ孤立字语音识别系统中,采用了３种说话人自适应方法,方法１,方法２为码本自适应,方法３为新人数据自适应,并将新建的１０００人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高１６％,达到９３％以上;在数据库的采用,使得不定人的数字识别率达到相似文献

12.

基于UCR训练集重构的真实语音情感识别

戴明洋杨大利徐明星《北京机械工业学院学报》2012,(2):63-67

真实语音情感识别是使人机交互更加友好的重要手段,但是训练数据稀缺为这一领域带来很多挑战。为了减小这一阻碍,提出了语句串接与重采样(UCR)方法,以便高效利用存在的训练数据。UCR方法是将原始音频样本按照情感类型进行串接,形成一个长的音频流,以一个固定粒度对其随机乱序,然后将其切割,并通过多次重采样操作来增加支持向量机(SVM)的训练样本数。实验基于一个从访谈节目中录制的真实语音情感库。实验结果表明,在统一背景模型-高斯混合模型-支持向量机(UBM—GMM—SVM)识别框架中这种训练集重构的方法错误率降低近33.10%。相似文献

13.

基于粒子群优化算法的矢量量化图像压缩方法

姜来黄彩玲纪震《深圳大学学报(理工版)》2006,23(3):268-271

提出一种基于粒子群优化算法的图像矢量量化码书设计算法．该算法引入粒子群的全局搜索策略，结合矢量量化码书设计方法，增加了算法解的随机性和多样性．实验结果显示，本算法与传统LBG码书设计算法相比，具有更强的鲁棒性，可有效解决LBG算法对初始码书的依赖性，能获得性能较好的码书．相似文献

14.

隐马氏链模型识别汉语四声声调

陈锡先蔡长年郭鹏孙颖《北京邮电大学学报》1988,11(1):1

本文提出一种用隐马氏链模型识别汉语声调的新方案。由每一种声调的训练语音求出相应的概率模型参数作为识别模板。识别时,分别用每一种声调的模型参数计算出现输入语声周期序列的概率,概率最大者即为输入语声的声调模型。实验语音选用的是“小学汉语拼音教学录音磁带”,一个男声和一个女声,对于其中的24个韵母和21组拼音音节,正确识别率为98%。相似文献

15.

新的学习矢量量化初始码书算法 总被引：1，自引：0，他引：1

黎洪松刘洪伟《北京邮电大学学报》2006,29(4):33-35

针对原有随机数设置法、训练矢量集随机抽取法和LGB分裂法等初始码书算法存在的码矢利用率较低、运算量大和与信源匹配程度不高等不足,提出了一种新的分离平均法,并应用到基于自组织特征映射算法（SOM）的学习矢量量化（LVQ）中,图像矢量量化的实验表明,分离平均初始码书算法具有无效码矢数量少、码书性能高、运算量小、实现简单等优点。相似文献

16.

基于VQ的高效汉语语音识别方法的比较性研究

谢湘赵军辉匡镜明《北京理工大学学报(英文版)》2002,11(3):266-270

介绍了一种基于VQ的小词汇量特定人快速语音识别方法,并对该方法中的关键参数进行了比较性研究. 这一方法尤其适用于汉语特定人小词汇量语音识别. 与典型的HMM和NN识别算法相比,该方法复杂度低、系统资源消耗少而识别率高,在对汉语11个数字的大规模识别测试中误识率仅为3.86%. 因此,该方法适合于在手机、PDA等资源有限的系统中实现语音数字拨号、人名拨号及查询等语音控制功能. 相似文献

17.

改进VQ算法在说话人识别中的应用

张庆芳赵鹤鸣《苏州大学学报(工科版)》2005,25(6):1-4

与文本无关的说话人识别方法是当前说话人识别技术的研究重点。基于矢量量化的说话人识别，因其运算过程简单等特点，在说话人识别领域有着广泛的应用。本文对矢量量化的码书形成算法进行了改进，并基于改进算法进行了与文本无关的说话人识别。经实验结果证明，本文的方法改善了码本的性能，提高了说话人识别的识别率。相似文献

18.

计算机语声命令输入系统

陈锡先蔡长年郭鹏《北京邮电大学学报》1991,(3)

本文介绍的计算机语声命令输入系统能够通过话筒直接输入语声命令,同时也可用键盘进行操作.系统采用经过实时优化的连续矢量量化聚(CVQC)算法,可在以 TMS32010为主体的高速信号处理板(UDSP-10)上实时进行语声命令的训练和识别。识别响应时间小于20ms.本文详细讨论了系统的硬件结构,识别算法和系统接口软件。最后给出了系统识别率指标。相似文献

19.

基于DHMM和VQ的关键词识别系统研究

阙大顺赵永安文先林李蓓《武汉理工大学学报》2011,(2)

针对现有关键词识别系统采用很难用硬件电路准确描述的连续隐马尔可夫模型CHMM作为识别模型,提出用离散隐马尔可夫模型DHMM作为系统的识别模型,研究了适用于硬件实现的状态机端点检测算法,并通过引入VQ矢量量化模块来保证离散关键词识别系统的识别率和识别速度;根据关键词训练模型,分析所采集语音信息中是否存在指定的关键词并进行准确识别。实验结果表明,该算法在便于硬件实现的基础上,具有良好的识别率和实时性,为关键词识别系统的FPGA硬件电路实现研究提供了参考。相似文献