首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
现有的语音交互系统在提取特征参数时难以保证滤波器的通道数量,导致音频识别准确率较差,为提高音频的识别能力,基于MFCC系数设计语音交互系统。在硬件设计中,设计通讯寄存器芯片架构,设计音频录入并行电路,保证大量音频数据在短时间内录入的稳定性。在软件设计中,将音频信号预加重,量化信号输入信噪比,基于MFCC系数提取音频数据特征参数,保证滤波信号通道数量,设计音频交互算法,计算训练最大似然度。在实验中对比四种语音交互系统的音频识别能力,实验数据显示,该系统音频数据识别准确率在五类音频信号中约为67%-97%,其他三种系统的识别准确率分别为62%-92%、66%-89%、67%-91%,由此可见该系统识别准确率高于这三种系统,基于MFCC系数的语音交互系统可以更好地处理与转换音频数据。  相似文献   

2.
为提高智能语音交互机器人语音交互的准确率,提出一种基于意图识别的机器人智能英语语音交互方法。通过引入Glove_BiGRU_Self-attention分类预测模型构建意图识别功能模块,并采用ROS分布式架构对系统功能模块进行整合,实现人机的智能语音交互。仿真结果表明,采用所提方法进行的语音意图识别,具有更高的准确率,相较于基于DCNN模型、基于CNN-LSTM模型与基于单向构建的GRU-Self-attention模型的意图识别方法,识别准确率分别高出8.03%、4.07%和2.14%,具有更好的识别效果;在特征提取上,训练时间较传统基于BiLSTM模型的提取方法,BiGRU的训练时间缩短了4倍,训练效率更高。实验结果表明,采用所提意图识别方法搭建的语音交互系统,对用户英语语音指令的识别准确率和识别效率依然拥有较好的结果,识别平均准确率达到了89.72%,识别时间均在0.35 s之内,证明所提方法可以应用于实际语音交互之中。应用实验表明,采用基于意图识别方法搭建的智能语音交互机器人,无论是在问答交互还是控制命令上,都可以准确对用户英语指令进行识别,根据用户要求进行相关回答或完成相应动...  相似文献   

3.
为了提高博物馆讲解机器人的综合服务质量,设计了一种基于语音识别的博物馆讲解机器人自动交互系统。首先,对自动交互系统的整体框架进行了设计,包括基础信息、语音交互、人脸识别、路径导航以及系统设置5个功能模块;然后,重点对语音交互模块进行设计,设计思路为通过语音唤醒、语音识别与意图识别来实现博物馆讲解机器人的语音自动交互功能;最后,对语音交互模块中的核心功能,即意图识别与语音交互功能进行实验与测试。测试结果表明:设计的意图识别模块最快能够在1.6 s内对用户意图进行识别并给出相应的反馈,在相对安静的博物馆室内环境中,语音交互系统与游客进行语音交互的正确率能达到95%以上,展品讲解工作的完成正确率达到了98.3%;在相对嘈杂的博物馆室外环境中,语音交互的正确率较低,但也维持在90%左右;能够使博物馆讲解机器人能够快速流畅地与游客进行自动交互,并准确有效地完成展品讲解工作,具有一定的应用价值。  相似文献   

4.
当前中外语学习口语环境的不足问题已导致学生在语言应用过程中出现了许多困难。研究针对该问题提出了一种基于语音识别技术的在线语音交互学习系统。从语音输入质量入手,在预处理步骤上进行语言信号时域特征的变换,针对计算量和存储空间性能对动态时间规整算法进行改进,并基于改进算法构建在线韩语交互学习系统。实验结果表明,优化算法与混合模式方案,在不同的噪音与信嗓比背景下,混合模型的音频识别错误率均低于30%,在40 dB的条件下识别错误率低于16%。融入优化算法的教学系统在40 dB的条件下错误率低于13%。说明HMM与DBN混合模型更适用于韩语语言识别教学系统,此次设计的基于语音识别的语言交互学习系统具有一定应用价值。  相似文献   

5.
针对中国逐渐步入老龄化时代,传统交互方式的物联网系统操作繁杂、不够人性化的问题,提出了一种基于语音识别和物联网技术智能融合的新型物联网系统。首先,通过引入内置处理器的语音识别模块,不仅实现了传统语音识别,还实现了语音的云端传输,突破了主控芯片的计算能力和储存能力低的瓶颈;然后,利用物联网技术把复杂的算法置换到云端去执行,在语音识别方面有质的变化,结合云端分布式储存的特点,能够分门别类地建立用户的语音数据库,在用户习惯学习时提供大量的数据基础;最后,根据大量的数据基础,逐渐通过学习能力建立属于用户个人的语音识别库。通过实验对所提出的智能融合式物联网系统在语音识别的准确度、计算能力、语音交互的智能化程度等方面进行了有效性验证。实验结果表明,在语音识别精度方面随着距离增加至10 m以上,所提系统的准确度仍可达到70%以上,语音数据计算能力方面提高了31倍,同时在语音交互的智能化程度方面性能更优。该系统为老年人使用物联网交互提供了便利。  相似文献   

6.
基于性别识别的分类CHMM语音识别   总被引:2,自引:0,他引:2       下载免费PDF全文
对语音识别进行了探讨,提出一种通过性别识别对连续隐马尔可夫模型(CHMM)分类的方法,在此基础上进行语音识别。首先,通过计算性别判定语音信号的Mel频率倒谱系数(MFCC)使用CHMM对说话人性别进行识别,然后再根据不同性别使用分类CHMM进行语音识别。最后通过实验验证了方法的有效性。  相似文献   

7.
设计了一款具有语音交互功能的智能照明控制系统。首先准备语音样本进行深度学习训练,将训练后的语音数据存储到嵌入式开发平台,实现离线语音控制。通过深度学习库Tensorflow和循环神经网络RNN 将麦克风采集到的语音信号经过音频解码转化成语音数据,在时域段进行分帧、加窗等预处理工作,在频域段利用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficent,MFCC)进行特征提取;然后再对所提取的特征值利用声学模型进行分类识别。最后主控芯片通过I2S音频协议和语音模块建立连接,通过BLE Mesh蓝牙组网和控制系统中的灯具进行通信,实现智能照明控制系统的语音交互。  相似文献   

8.
基于HMM算法的语音识别系统设计及其混合编程实现   总被引:3,自引:0,他引:3  
许丽红  余小清  万旺根 《计算机工程》2002,28(5):139-140,163
介绍了连续M元高斯混合密度的隐马尔可夫语音识别系统,提出了一种基于分段K平均法的初始化模型参数方法;将可靠性度量方法结合到Baum-Welch重估算法中去,简化了算法复杂度。系统的实现采用C++与Matlab混合编程,提高了整个系统的开发效率。  相似文献   

9.
基于神经网络的语音情感识别   总被引:3,自引:1,他引:3       下载免费PDF全文
研究目的就是通过深入分析各种语音情感特征,找出其中对情感识别有较大贡献的特征,并寻找适合的模型将有效特征加以利用。分析和研究了多位科学家在进行语音情感分析过程中采用的方法和技术,通过总结和创新建立了语音情感语料库,并成功地提取了相关的语音信号的特征。研究了基音频率、振幅能量和共振峰等目前常用的情感特征在语音情感识别中的作用,重点研究了MFCC和?驻MFCC,实验发现特征筛选后系统的识别效果有着一定程度的提高。将处理后的频谱特征参数同原有的BP人工神经网络模型有效地结合起来,形成完整的语音情感识别系统,取得了较为满意的识别结果。  相似文献   

10.
常规智能电网调度系统主要使用分布式存储虚拟化技术划分调度任务模块,易受服务对象性质变化的影响,导致其在多用户并发操作时运行异常,为此,基于语音交互设计了一种全新的智能电网调度系统。硬件部分设计了ATML嵌入式存储芯片及STM处理器,软件部分基于语音交互技术构建了智能电网调度架构,设计了智能电网调度功能模块,实现了智能电网调度。结果表明,该系统在多用户并发操作时均能正常运行,证明系统性能良好、可靠。  相似文献   

11.
宋羽凯  谢江 《计算机工程》2023,49(5):122-128
现有的语音情感识别(SER)模型存在训练参数量大、模型泛化性能差、情感识别准确率低等问题,利用有限的语音情感数据建立一个轻量级的模型以提高识别效率和准确率尤为重要.提出一种轻量级端到端多任务学习的P-CNN+Gender深度模型,该模型由语音特征组合网络、负责情感特征和性别特征提取的主体卷积网络以及情感和性别分类器组成.以语音的梅尔频率倒谱系数(MFCC)特征作为输入,特征组合网络使用多个大小不同的卷积核从MFCC特征中平行提取特征再进行组合,供后续的主体卷积网络进行情感特征和性别特征的提取.考虑到情感表达和性别的相关性,将性别分类作为辅助任务融合到情感分类中以提高模型的情感分类性能.实验结果表明,该模型在IEMOCAP、Emo-DB和CASIA语音情感数据集上的类别分类准确率分别达到73.3%、96.4%和93.9%,较P-CNN模型分别提高3.0、5.8和6.5个百分点,与3D-ACRNN、CNNBiRNN等模型相比,其训练参数量仅为其他模型的1/10~1/2,且处理速度更快、准确率更高.  相似文献   

12.
基于改进LPCC和MFCC的汉语耳语音识别   总被引:5,自引:0,他引:5       下载免费PDF全文
以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得出的识别率为94.5%。  相似文献   

13.
文中设计出一款多功能智能拐杖,可以实现路径规划、自主导航、物品识别、语音交互等功能,最重要的是可以让老人对智能拐杖进行语音控制,使之更加便捷化、智能化,从而更好地为老人服务。语音交互功能采用STM32F405作为底层开发板,分为语音识别、语音合成以及语音控制等部分。  相似文献   

14.
本文以凌阳SPCE061A单片机作为核心控制器,设计了一种基于语音识别技术的语音控制智能手系统.系统由微控制器、语音模块、电机模块、光电寻迹模块、无线控制模块等部分组成.控制器利用语音模块识别出操作人员的语音命令后,通过电机模块与光电寻迹模块的协同工作来完成预设的多个复杂动作.本设计还加入了无线控制功能,可以在特殊情况下替代部分语音指令来操控智能手.  相似文献   

15.
《信息与电脑》2019,(17):110-112
目前,市面上搭载着语音交互系统的产品有很多,但是绝大部分的交互命令都局限于固定的关键词,在人工智能备受关注的今天,这样的设计显得尤为不人性化。针对上述问题,本设计开发了搭载有自然语言处理的智能语音交互系统,模仿了人类对话的方式与风格,设备能通过分析自然语言逻辑进入不同的功能场景,并根据自然语言解析后的语义完成相应的指令操作。该系统除了具有语音交互系统的基本功能外还实现了语音唤醒、闲聊对话、音乐播放和备忘提醒,能够满足使用者对于聊天对话的日常需求。  相似文献   

16.
语音识别技术在新一代呼叫中心的IVR系统中得到了广泛应用。本文讨论了一个基于语音识别的IVR系统的设计与实现,首先介绍了系统的结构和主要模块,之后介绍了本系统的难点和解决办法。最后从识别率、鲁棒性方面对该系统进行了测试和分析,实验结果表明,该语音识别系统是稳定的实用的。  相似文献   

17.
智能人机交互正作为一种新型沟通手段,逐渐走进人们的生活。近几年,语音技术逐渐改变人们的生活和工作方式。语音控制能实现交互高效、流畅、无缝,语音识别与合成技术是核心。笔者基于语音交互中的相关问题,提出Speech SDK平台残疾人辅助交互系统设计方案,有利于残障人士通过语音控制进行操作,希望通过探讨可以促进智能人机交互技术的推广应用。  相似文献   

18.
为提高语音阅读交互系统中回复内容的匹配速率和准确率,从信息匹配的算法入手,提出基于attention机制对传统seq2seq模型进行改进,并引入beam search算法对语音识别结果进行剪枝,选择出最佳的匹配内容输出;接着进行语音阅读交互系统设计,选择语音识别系统、设定文本信息向编码信息转换的方式、对基于改进seq2seq模型的答复匹配设计;最后为验证改进后的seq2seq模型在语音阅读交互系统中的优势,配置语音阅读交互系统运行的实验环境,并进行算法验证实验。最终的结果证明,改进后的算法损失函数的收敛性性能更好;交互时回复信息的相关性明显高于改进前,且回复的信息的内容更为丰富。  相似文献   

19.
监控系统的语音识别与语音提示   总被引:1,自引:0,他引:1  
介绍了一种采用语音识别和语音提示的监控系统。给出了系统硬件框图,并对各部门分功能进行了阐述;重点论述了各部分电路设计、工作原理及语音提示部分电路和通讯接口电路的软件设计思想,并给出主程序流程图。  相似文献   

20.
针对语音情感的动态特性,利用动态递归Elman神经网络实现语音情感识别系统。通过连接记忆上时刻状态与当前网络一并输入,实现Elman网络模型的状态反馈。基于此设计了语音情感识别系统,该系统能在后台修改网络类型,并实现单语句与批量语句识别模式。针对系统进行语音情感识别实验表明,基于Elman神经网络的语音情感识别在同等参数模型设置前提下优于BP神经网络识别效果,且BP神经网络参数设置较Elman网络敏感。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号