首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在对语音识别基本理论阐述的基础上,研究了DHMM、DTW和CHMM三种不同的语音识别算法,并通过在MATLAB环境下搭建孤立词数字语音识别系统得出三种不同语音识别算法的具体运行数据,验证了识别理论的正确性,对比三种不同语音识别算法优缺点,为硬件实现语音识别系统提供了重要参考。  相似文献   

2.
为获得更丰富的情感信息、有效识别长语音的情感状态,提出基于D-S证据理论的多粒度语段融合语音情感识别方法。采用2种分段方法对语音样本分段,用SVM对语段进行识别,再利用D-S证据理论对各语音段识别结果进行决策融合,得到2种分段方法下语音的情感识别结果,将这2个识别结果进一步融合得到最终结果。实验结果表明,该方法具有较好的整体识别性能,能有效提高语音情感的识别率。  相似文献   

3.
局域网并行处理在语音识别中的应用   总被引:1,自引:0,他引:1  
在语音识别中,不论是训练语音识别系统,还是使用系统识别语音,都需要进行大量的数据处理,这使得语音识别的研究和实现都变的非常困难。本文提出一种基于局域网的分布式计算机系统的快速并行数据处理方法来实现语音识别的模型训练和语音的识别,不仅加 了训练和识别的速度,节约了大量的时间,而且降低了语音识别任务对硬件的要求,取得了满意的效果。  相似文献   

4.
本系统是智能家居设备技术领域的一种用于控制智能家居的语言控制装置,具体涉及一种用于控制智能家居的语言控制装置。本项目结构简单,设计合理,使用方便,是一种控制智能家居的语言控制装置,使语音控制更加智能化,改变现有的信息交流方式,真正地实现人机交互。本文对当前已有的语音识别软件、语音识别的理论基础、语音识别的关键技术点进行说明并且结合Zig Bee/Smart Room无线技术对该系统做了深入研究。  相似文献   

5.
说话人识别是语音识别的一种,是当前的研究热点之一。而基于统计学习理论的支持向量机(SVM)方法是一种新的机器学习算法,已成为机器学习研究的热点。讨论了一种改进的SVM即最小二乘向量机(LS-SVM)的方法进行说话人识别研究。研究表明,基于LS—SVM的说话人识别比传统的SVM说话人识别计算复杂度小、效率更高、对说话人识别有很强的适应性。  相似文献   

6.
研究语音识别率问题,语音信号是一种非平稳信号,含有大量噪声信息,目前大多数识别算法线性理论,难以正确识别语音信号非线性变化过程,识别正确率低。通过将隐马尔可夫模型(HMM)和SVM相结合组成一个混合抗噪语音识别模型(HMM-SVM)。同时用HMM模型对语音信号时序进行建模,并得到待识别语音信号的输出概率,然后将输出概率作为SVM的输入进行学习,得到语音分类信息,最后通过利用HMM-SVM识别结果做出正确识别决策。仿真结果表明,HMM-SVM提高语音识别正确率,尤其在低信噪比环境下,明显改善了语音识别系统的性能。  相似文献   

7.
阐述语音人机交互手段的必要性及意义,提出一种基于语音控制的机器狗系统解决方案。该系统利用HTK和Julius构建大词汇量连续的语音识别平台,采用语音识别技术提取语音命令用于机器狗控制,并结合有限状态机的控制理论设计机器狗控制系统模型。测试结果表明,该系统能较好地识别用户语音命令,控制系统模型能有效完成机器狗在不同状态下的控制任务。  相似文献   

8.
针对汉语语音情感识别问题,提出了一种基于脉冲耦合神经网络(PCNN)的识别方法。该方法将语音转化为语谱图后输入到PCNN,得到输出图像的神经元点火序列及其熵序列作为语音情感的特征,利用其特征实现语音情感识别。实验结果表明,该方法可以有效地识别“高兴”与“平常”这两种不同的情感。该方法将PCNN引入到语音情感识别的应用研究中,开拓了语音和图像信号结合处理的新领域,同时对于PCNN的理论研究和实际应用具有重要的现实意义。  相似文献   

9.
利用语音命令实现与智能设备的交互已经成为现代控制理论研究的热门话题之一。介绍了一种基于数字信号处理器(DSP)、语音采集模块、无线收发模块、片上外设等资源实现的语音命令控制处理系统。该系统首先通过语音采集模块采集到语音控制信号;然后通过DSP和相应的片上外设实现对语音命令的识别;最后将识别的语音命令传递给无线收发模块以实现对于智能设备的控制。整个系统的设计应用领域广泛,可以为人机交互提供一种切实可行的参考方案。  相似文献   

10.
基音周期估计是语音处理和分析的最基本步骤。无论是做语音信号处理,语音压缩,还是语音识别,都要用到基音周期这一重要参数。文章基于随机共振的理论,提出了一种新的估计基音周期的方法。  相似文献   

11.
针对语音识别软件在有噪声干扰时识别准确率降低的问题,为确保使用语音控制操作的安全性,提出一种基于领域知识的语音识别鲁棒性增强方法。以舰艇操控为应用背景,建立舰艇操控领域知识图谱;从航海图书资料和经典海战影视资料中提取舰艇操控指令,构建舰艇操控指令中文语音数据集;提出一种嵌入领域知识的解码方法,通过计算识别结果与领域知识图谱的匹配度对输出控制指令进行修正。实验结果表明,相较于目前流行的连接时序分类解码方法和基于注意力机制的解码方法,所提解码方法在识别信噪比为10 dB和20 dB的带噪语音时字错误率分别下降了4.0%和1.5%,指令识别准确率分别提升了10.3%和6.3%,提高了语音识别模型识别中文指令的鲁棒性。  相似文献   

12.
基于SPCE061A的语音识别系统的研究   总被引:8,自引:3,他引:8  
提出了一种基于SPCE061A的语音识别系统,具体分析了其基本原理和主要构成,并对识别方式和程序设计进行了讨论。其语音样本的训练、被识别语音数据的采集及相关处理以及识别结果的输出等都是靠调用库函数来完成。最后,对实验数据进行了分析。  相似文献   

13.
传统模型较难识别出数量庞大的数据,为了提高对日语语音识别系统的准确率,此次研究综合了语音识别与深度学习的基本理论。在此基础上,提出使用Fbank特征作为声学模型的输入特征,构建了基于双向长短期记忆网络(Bi-directional Long-Short Term Memory, BiLSTM)的日语语音识别系统。结果表明,预加重后的日语语音信号能量变化幅度在-35 dB至0 dB的范围内,频谱分布更加平衡。在经过多轮次训练后,BiLSTM-CTC模型的词错率比其他两种模型分别低了11.03%、3.63%,具有更加优越的性能。在使用Fbank特征时,研究模型的词错率比使用梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients, MFCC)特征时低。这表明采用Fbank特征能够提高日语语音识别的精度。此次研究不仅对深度学习技术的发展提供重要的理论,还对以深层神经网络为基础的语音识别具有重要的现实意义。  相似文献   

14.
语音识别浏览器VoiceIE设计与实现   总被引:4,自引:0,他引:4  
语音识别浏览器VoiceIE提供一种全新的语音方式进行Internet WWW浏览适合各类办公自动化系统,特别是其于嵌入式系统的信息家电、PDA等应用领域。本文首先介绍VioceIE的系统结构及功能,然后阐述语音识别模块和浏览器模块的设计与实现方法,对浏览操作与窗口管理中基于COM编程和Internet API 运用,语音信号实时检测与识别中MIC API与互信息匹配模型MIC的运用,以及语音识别模块与浏览器模埠的数据通信等进行了描述。  相似文献   

15.
语音拒识技术是实现一个实用语音识别系统的关键。提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音。在一个非特定人英语命令词识别系统中做了一些相关的实验来评估这个算法的性能。实验结果表明,该算法可以有效地去除识别不可靠的语音,提高语音识别的整体性能。  相似文献   

16.
根据治语语音的特点,提出了一种无端点检测的语音识别算法。  相似文献   

17.
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。  相似文献   

18.
提出一种新型车载语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别。同时提出了一种新的抗噪语音识别方法,改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好的抑制了噪声干扰,提高了语音识别率。  相似文献   

19.
为解决小样本中文语音情感识别准确度低的问题,提出一种基于残差网络改进的中文语音情感识别网络结构AResnet。使用时域增强和频域增强生成更复杂的模拟样本扩充语音情感数据,将注意力机制引入至残差网络(residual networks)中,关注谱图中情感特征分布,提升情感识别率。在CASIA中文语音数据集上训练、测试,其结果显示,对比DCNN+LSTM、Trumpt-6网络结构,识别率分别提升约14.9%、3%,验证了AResnet在中文语音情感识别中的有效性。该方法也在英语语音数据集eNTERFACE’05上进行实验,识别准确率为92%,验证了AResnet有较好的泛化能力。  相似文献   

20.
语音信号是一种时变、非平稳的随机信号。现有语音识别系统的适应性比较差,尤其在高噪声环境下的语音识别非常困难,若将语音识别系统商品化,还有识别速度、拒识问题以及关键词/句检测技术等细节问题需要解决。如何把语言学、生理学、心理学方面的研究成果量化、建模并用于语音识别,还需深入研究。本文介绍了语音识别中小波分析的研究现状及几种常见的技术方法,并且分析探讨了语音识别中小波分析的应用和发展前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号