首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
首先在对比实验的基础上得出推论,在训练矢量本身分布不均匀的情况下,初始码本的设置应该使由各初始码字聚类形成的胞腔在总畸变上尽可能均衡,分析并给出了一初始码字生成原则的全理解释,以此原则出发,提出了一种新的初始码字生成算法,最后用实验验证了这一原则和基于此原则的初始码字生成算法的有效性。  相似文献   

2.
3.
提出用非线性规整的多门限过零率矢量及过零幅度差来识别0~9十个数字,通过加入自适应算法,提高了识别率,这种方法计算简单,快速,易于用单片机做成实时语音识别系统,具有实用价值。  相似文献   

4.
针对朝鲜语数字串语音识别中单位符号容易被误判为数字的问题,提出了基于朝鲜语数字串结构特点的识别方法.首先,对事先采集好的语音样本提取特征并存储成数字模板和单位符模板;其次,将数字串测试样本切分成孤立的数字或单位符并提取特征参数;最后,根据朝鲜语数字串发音特点,即若前1个孤立词已被识别为数字,那么后1个被默认为单位符并且只与存储单位符号的模板进行匹配.实验结果表明,该方法不仅可以获得较高的正确识别率,同时提高了识别效率.  相似文献   

5.
利用语音合成芯片 TC8830 AF的 CPU控制方式下的 DMA功能 ,主控微机可共享语音数据存储器 SRAM资源 ,对语音数据直接操作 ,实现语音数据的快速处理 ,对语音合成库的建设机理进行了深入探讨 ,并提出了一种实用的汉语数码语音识别方法 .实践结果表明本系统适用于语音合成产品的开发  相似文献   

6.
应用聚类有效性分析来生成可变电码本,实验数据表明,此算法能够根据每个说话人的语音特征自动生成大小合适的电码本,并且能够保持性能的条件下有效减小电码本的大小。  相似文献   

7.
本文在过零周期序列转移概率算法的基础上,提出了一种改进方法,即从语音的过零周期序列中,找出其“过渡音段”,给以加权。通过对特定人孤立字(0~9十个数字)的实验,结果表明改进后的方法识别率有所提高,但并未使算法复杂化。  相似文献   

8.
为了解决连续的语音识别对端点的依赖性问题,提出了一种基于高维空间点覆盖动态搜索理论的非特定人问候语连续语音识别的新算法,该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小来判断识别结果.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

9.
车载自动语音识别系统设计   总被引:1,自引:0,他引:1  
随着车载电子设备的蓬勃发展,驾驶过程中操作设备的危险性也日益提高,如何在驾驶过程中安全地使用设备也逐渐被提上议事日程.本文开发的车载自动语音识别系统可以很好地解决这一问题.本文采用单片机STC10L08XE和OMAP3530为核心处理器,语音识别专用芯片LD3320为语音识别模块,设计了一套车载自动语音识别系统,并对软件系统的设计进行了阐述.该系统为非特定人语音识别,结构简单,识别准确率高达95%,性价比高,且识别列表的关键词可以动态编辑,与别的语音识别系统相比有明显优势,便于大力推广和应用.  相似文献   

10.
本文论述的是一种高质量、中低速码率的语音矢量量化编码.为了提高综合语音质量,在提取声道参数中采用了 Itakura-Saito 失真测试,并用高维残差矢量激励源.经过计算机模拟证明我们在训练码本时采用的一些方法是行之有效的.  相似文献   

11.
Mandarin Digits Speech Recognition Using Support Vector Machines   总被引:1,自引:0,他引:1  
A method of applying support vector machine (SVM) in speech recognition was proposed, and a speech recognition system for mandarin digits was built up by SVMs. In the system, vectors were linearly extracted from speech feature sequence to make up time-aligned input patterns for SVM, and the decisions of several 2-class SVM classifiers were employed for constructing an N-class classifier. Four kinds of SVM kernel functions were compared in the experiments of speaker-independent speech recognition of mandarin digits. And the kernel of radial basis function has the highest accurate rate of 99.33 %, which is better than that of the baseline system based on hidden Markov models (HMM) (97.08%). And the experiments also show that SVM can outperform HMM especially when the samples for learning were very limited.  相似文献   

12.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

13.
本文提出一种新的矢量量化方法压缩语音特征用于孤立字语音识别.新方法借鉴了隐马尔柯夫模型(HMM)中状态的概念来规划模板;用动态规划(Dyna-mic Progamming)的技术优化矢量量化产生的初始码字.新方法使得识别所需的模板库的尺寸明显减小,识别响应时问缩短,而且由于模板的优化,使得系统的正确识别率显著提高.  相似文献   

14.
本文对语音的上升过零间隔从发音机理及统计角度进行了分析,认为语音信号及其差分信号的上升过零间隔较好地体现了不同语音之间的差异性,是一种进行语音识别的理想参数,并利用该参数建立模板,以非线性分块法进行时间对准,以相邻三帧最佳匹配法进行模板匹配,用软件模拟了特定人、小词汇量、孤立词的语音识别,得到了较好的实验结果。  相似文献   

15.
不定人语音识别系统   总被引:1,自引:0,他引:1  
采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型DHMM孤立字语音识别系统中,采用了3种说话人自适应方法,方法1,方法2为码本自适应,方法3为新人数据自适应,并将新建的1000人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高16%,达到93%以上;在数据库的采用,使得不定人的数字识别率达到  相似文献   

16.
Linear discriminant analysis and kernel vector quantization are integrated into vector quantization based speech recognition system for improving the recognition accuracy of Mandarin digits. These techniques increase the class separability and optimize the clustering procedure. Speaker-dependent (SD) and speaker-independent (SI) experiments are performed to evaluate the performance of the proposed method. The experiment results show that the proposed method is capable of reaching the word error rate of 3.76 % in SD case and 6.60 % in SI case. Such a system can be suitable for being embedded in personal digital assistant(PDA), mobile phone and so on to perform voice controlling such as digit dialing, calculating, etc.  相似文献   

17.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

18.
矢量量化(VQ)是一种广泛应用于说话人识别系统的算法,基于对各说话人空间矢量内的相关性的研究,结合PNDM算法,利用Matlab软件对说话人识别系统进行研究。经实验结果证明,该方法有效增加了说话人间的区分性,提高说话人识别系统的识别率。  相似文献   

19.
基于矢量量化改进算法的说话人识别   总被引:2,自引:0,他引:2  
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显  相似文献   

20.
基于编码比特流的说话人识别   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现代通信系统中压缩语音信号的特点,给出了编码域说话人识别的框架。在此框架下,研究了从GSM FR、G.729、G.723.1(6.3 k)3种语音编码器的码流中直接提取参数的方法。实验表明,在识别准确率和计算速度上,编码域说话人识别均优于传统的基于解码语音的说话人识别方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号