共查询到20条相似文献,搜索用时 15 毫秒
1.
在对语音识别基本理论阐述的基础上,研究了DHMM、DTW和CHMM三种不同的语音识别算法,并通过在MATLAB环境下搭建孤立词数字语音识别系统得出三种不同语音识别算法的具体运行数据,验证了识别理论的正确性,对比三种不同语音识别算法优缺点,为硬件实现语音识别系统提供了重要参考。 相似文献
2.
3.
局域网并行处理在语音识别中的应用 总被引:1,自引:0,他引:1
在语音识别中,不论是训练语音识别系统,还是使用系统识别语音,都需要进行大量的数据处理,这使得语音识别的研究和实现都变的非常困难。本文提出一种基于局域网的分布式计算机系统的快速并行数据处理方法来实现语音识别的模型训练和语音的识别,不仅加 了训练和识别的速度,节约了大量的时间,而且降低了语音识别任务对硬件的要求,取得了满意的效果。 相似文献
4.
《电子制作.电脑维护与应用》2016,(6)
本系统是智能家居设备技术领域的一种用于控制智能家居的语言控制装置,具体涉及一种用于控制智能家居的语言控制装置。本项目结构简单,设计合理,使用方便,是一种控制智能家居的语言控制装置,使语音控制更加智能化,改变现有的信息交流方式,真正地实现人机交互。本文对当前已有的语音识别软件、语音识别的理论基础、语音识别的关键技术点进行说明并且结合Zig Bee/Smart Room无线技术对该系统做了深入研究。 相似文献
5.
说话人识别是语音识别的一种,是当前的研究热点之一。而基于统计学习理论的支持向量机(SVM)方法是一种新的机器学习算法,已成为机器学习研究的热点。讨论了一种改进的SVM即最小二乘向量机(LS-SVM)的方法进行说话人识别研究。研究表明,基于LS—SVM的说话人识别比传统的SVM说话人识别计算复杂度小、效率更高、对说话人识别有很强的适应性。 相似文献
6.
研究语音识别率问题,语音信号是一种非平稳信号,含有大量噪声信息,目前大多数识别算法线性理论,难以正确识别语音信号非线性变化过程,识别正确率低。通过将隐马尔可夫模型(HMM)和SVM相结合组成一个混合抗噪语音识别模型(HMM-SVM)。同时用HMM模型对语音信号时序进行建模,并得到待识别语音信号的输出概率,然后将输出概率作为SVM的输入进行学习,得到语音分类信息,最后通过利用HMM-SVM识别结果做出正确识别决策。仿真结果表明,HMM-SVM提高语音识别正确率,尤其在低信噪比环境下,明显改善了语音识别系统的性能。 相似文献
7.
8.
9.
10.
基音周期估计是语音处理和分析的最基本步骤。无论是做语音信号处理,语音压缩,还是语音识别,都要用到基音周期这一重要参数。文章基于随机共振的理论,提出了一种新的估计基音周期的方法。 相似文献
11.
针对语音识别软件在有噪声干扰时识别准确率降低的问题,为确保使用语音控制操作的安全性,提出一种基于领域知识的语音识别鲁棒性增强方法。以舰艇操控为应用背景,建立舰艇操控领域知识图谱;从航海图书资料和经典海战影视资料中提取舰艇操控指令,构建舰艇操控指令中文语音数据集;提出一种嵌入领域知识的解码方法,通过计算识别结果与领域知识图谱的匹配度对输出控制指令进行修正。实验结果表明,相较于目前流行的连接时序分类解码方法和基于注意力机制的解码方法,所提解码方法在识别信噪比为10 dB和20 dB的带噪语音时字错误率分别下降了4.0%和1.5%,指令识别准确率分别提升了10.3%和6.3%,提高了语音识别模型识别中文指令的鲁棒性。 相似文献
12.
基于SPCE061A的语音识别系统的研究 总被引:8,自引:3,他引:8
提出了一种基于SPCE061A的语音识别系统,具体分析了其基本原理和主要构成,并对识别方式和程序设计进行了讨论。其语音样本的训练、被识别语音数据的采集及相关处理以及识别结果的输出等都是靠调用库函数来完成。最后,对实验数据进行了分析。 相似文献
13.
传统模型较难识别出数量庞大的数据,为了提高对日语语音识别系统的准确率,此次研究综合了语音识别与深度学习的基本理论。在此基础上,提出使用Fbank特征作为声学模型的输入特征,构建了基于双向长短期记忆网络(Bi-directional Long-Short Term Memory, BiLSTM)的日语语音识别系统。结果表明,预加重后的日语语音信号能量变化幅度在-35 dB至0 dB的范围内,频谱分布更加平衡。在经过多轮次训练后,BiLSTM-CTC模型的词错率比其他两种模型分别低了11.03%、3.63%,具有更加优越的性能。在使用Fbank特征时,研究模型的词错率比使用梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients, MFCC)特征时低。这表明采用Fbank特征能够提高日语语音识别的精度。此次研究不仅对深度学习技术的发展提供重要的理论,还对以深层神经网络为基础的语音识别具有重要的现实意义。 相似文献
14.
15.
16.
17.
屈瑾 《自动化与仪器仪表》2023,(1):221-225
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。 相似文献
18.
提出一种新型车载语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别。同时提出了一种新的抗噪语音识别方法,改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好的抑制了噪声干扰,提高了语音识别率。 相似文献
19.
为解决小样本中文语音情感识别准确度低的问题,提出一种基于残差网络改进的中文语音情感识别网络结构AResnet。使用时域增强和频域增强生成更复杂的模拟样本扩充语音情感数据,将注意力机制引入至残差网络(residual networks)中,关注谱图中情感特征分布,提升情感识别率。在CASIA中文语音数据集上训练、测试,其结果显示,对比DCNN+LSTM、Trumpt-6网络结构,识别率分别提升约14.9%、3%,验证了AResnet在中文语音情感识别中的有效性。该方法也在英语语音数据集eNTERFACE’05上进行实验,识别准确率为92%,验证了AResnet有较好的泛化能力。 相似文献
20.
语音信号是一种时变、非平稳的随机信号。现有语音识别系统的适应性比较差,尤其在高噪声环境下的语音识别非常困难,若将语音识别系统商品化,还有识别速度、拒识问题以及关键词/句检测技术等细节问题需要解决。如何把语言学、生理学、心理学方面的研究成果量化、建模并用于语音识别,还需深入研究。本文介绍了语音识别中小波分析的研究现状及几种常见的技术方法,并且分析探讨了语音识别中小波分析的应用和发展前景。 相似文献