首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。  相似文献   

2.
现有的语音交互机器人多采用用户提问、机器人回答的单向交流方式,人机交互的智能性和灵活性较差.本文研究运用树莓派(Raspberry Pi)计算机和配套的语音板作为硬件载体,融合语音唤醒、语音识别、语音合成、自然语言处理等人工智能技术,调用科大讯飞开放云平台、在线图灵机器人,搭建一种基于云平台的智能语音交互机器人系统,并...  相似文献   

3.
《信息与电脑》2019,(17):110-112
目前,市面上搭载着语音交互系统的产品有很多,但是绝大部分的交互命令都局限于固定的关键词,在人工智能备受关注的今天,这样的设计显得尤为不人性化。针对上述问题,本设计开发了搭载有自然语言处理的智能语音交互系统,模仿了人类对话的方式与风格,设备能通过分析自然语言逻辑进入不同的功能场景,并根据自然语言解析后的语义完成相应的指令操作。该系统除了具有语音交互系统的基本功能外还实现了语音唤醒、闲聊对话、音乐播放和备忘提醒,能够满足使用者对于聊天对话的日常需求。  相似文献   

4.
在自然人机对话中,由于环境噪声、方言口音等因素带来的语音识别错误以及语义分析的不充分等原因,计算机在理解用户交互意图时出现偏差,使得计算机对要反馈的话题出现错误,造成人机对话进程的断裂.以面向咖啡为主题的漫谈式人机对话为例,将对话中断分为3种情况:话题反馈不当引起中断、话题正确情况下的模糊反馈不当和精确反馈不当引起中断.根据用户与计算机对话的记录分析比较上述3种情况下人机对话进程断裂情况.统计数据结果表明,话题反馈不当带来的对话中断最为明显,在对话进程断裂情况中达到了60.1%的比例;在话题反馈正确情况下,模糊回答不当和精确回答不当带来的话题中断比例分别为22.2%和21.6%;在语音识别错误情况下,语义分析会带来数量更大的反馈错误.实验数据分析结果表明,在语音识别错误情况下,根据上下文信息提高计算机对用户话题反馈的准确率,能够有效降低人机对话的中断,提高人机对话的自然度.该工作为自然人机对话的意图分类重要性提供了数据分析和实验论证.  相似文献   

5.
提出了一种具有语音识别功能的智能分类垃圾桶的设计方案,当用户想要扔垃圾时,只要一声令下,垃圾桶就会随叫随到快速准确地到达身边,而且只要说出所扔垃圾的名称,相应类别的垃圾筒盖就会自动打开.另外,对传统垃圾桶存在的难以移动,堵墙角过道,操控不便,垃圾分类不便捷等问题,都可以通过所设计的智能垃圾桶来完美解决.由于本作品具...  相似文献   

6.
当前中外语学习口语环境的不足问题已导致学生在语言应用过程中出现了许多困难。研究针对该问题提出了一种基于语音识别技术的在线语音交互学习系统。从语音输入质量入手,在预处理步骤上进行语言信号时域特征的变换,针对计算量和存储空间性能对动态时间规整算法进行改进,并基于改进算法构建在线韩语交互学习系统。实验结果表明,优化算法与混合模式方案,在不同的噪音与信嗓比背景下,混合模型的音频识别错误率均低于30%,在40 dB的条件下识别错误率低于16%。融入优化算法的教学系统在40 dB的条件下错误率低于13%。说明HMM与DBN混合模型更适用于韩语语言识别教学系统,此次设计的基于语音识别的语言交互学习系统具有一定应用价值。  相似文献   

7.
为提升自动控制效果,加快翻译速率,设计基于智能语音的翻译机器人自动化控制系统。采集外界智能语音信号,利用A/D转换器得到数字信号,启动语音唤醒模块激活翻译机器人,听写模式识别复杂语音信号,命令模式识别简单语音信号,得到语言文本识别结果,通过深度学习关键词检测方法提取关键词作为翻译机器人的自动化控制指令,通过单片机识别自动化控制指令。实验结果表明,该系统可有效采集外界智能语音信号,提取智能语音信号的关键词,完成翻译机器人自动化控制。  相似文献   

8.
《微型机与应用》2016,(17):52-54
语音识别或语言转化成文本的过程包括捕获声波,数字化声波,转换成基本的语言单位或者音素,根据音位和语境构建词语,分析词语,保证拼写正确,并且保证与听到的词语保持一致。该文把人工智能和神经网络技术应用到语音识别系统中,通过学习获得固定权重并应用到模型,最后模型快速给出与输入相匹配的输出。文中涉及到的神经网络模型主要用来进行语音识别。  相似文献   

9.
为进一步提升当前英语服务型机器人的人机交互效果,以语音识别为基本方法,提出一种英语智能对话人机交互系统。通过对交互系统的特征参数提取方法以及语音识别模型进行优化,同时结合对应的模块设计,一定程度上提升了交互系统的性能。仿真结果表明,与其他特征参数提取算法相比,本研究的LPMFCC特征参数提取算法的具有更高的识别率,达到了88.5%;与改进前的HMM模型相比,本研究提出的改进HMM模型能够更快完成训练且训练误差更低,仅需4次训练即可完成训练。以上结果表明了本研究提出的英语智能对话人机交互系统能够取得具有良好的性能,能够取得较好的人机交互效果,对于实际的设计具有一定的参考价值。  相似文献   

10.
二十一世纪物联网在人们的生活中应用十分广泛,几乎是无处不在的.近些年来,国内外垃圾分类机器人的相关技术不断完善,产业正大规模地走向市场,以提供人们舒适的服务.以STM32单片机为主控芯片,利用ESP8266-01S无线WIFI模块连接物联网OneNet平台,实现语音识别垃圾分类功能,最后通过实践表明,本设计具有性价比高...  相似文献   

11.
12.
《计算机工程》2018,(1):199-205
为提高普米语语音识别系统的性能,引入深度学习模型进行普米语语音识别,该模型是一个高容量复杂的网络模型。以Kaldi语音识别工具包为实验平台,分别训练5种不同的声学模型,且这5种模型中包含一个有4隐层的深度神经网络模型。比较不同声学模型得到的语音识别率发现,G-DNN模型比Monophone模型的语音识别率平均提升49.8%。实验结果表明,当增加训练集的普米语语音语料量时,基于深度学习的普米语语音识别率会提升,而基于深度学习的普米语语音识别系统的鲁棒性比其余4个声学模型的普米语语音识别系统的鲁棒性更强。  相似文献   

13.
针对传统轮机模拟器的操作者身兼多职、人机交互复杂的问题,将语音识别技术应用于轮机模拟器。收集并制作轮机领域的语料库,提取语音信号的MFCC特征,基于Kaldi平台完成声学模型建立,使用SRILM工具建立语言模型并对比多元语言模型性能差异,针对语料稀疏问题使用Kneser-Ney平滑算法进行处理,建立用于操作轮机模拟器的语音交互系统。通过测试表明,能够实现使用语音操作轮机模拟器。  相似文献   

14.
捕捉客户来电意图信息,开展客户来电意图识别研究具有重要意义.现有的客户来电意图识别大都是采用人工分析方法,尚没有采用机器学习、深度学习模型识别客户来电意图的研究.为降低人工分析代价,提高客户来电意图识别结果,该文分别从基于传统机器学习模型、基于单/多深度学习模型、基于BERT和深度学习模型组合三个方面,进行客户来电意图...  相似文献   

15.
现有的语音交互系统在提取特征参数时难以保证滤波器的通道数量,导致音频识别准确率较差,为提高音频的识别能力,基于MFCC系数设计语音交互系统。在硬件设计中,设计通讯寄存器芯片架构,设计音频录入并行电路,保证大量音频数据在短时间内录入的稳定性。在软件设计中,将音频信号预加重,量化信号输入信噪比,基于MFCC系数提取音频数据特征参数,保证滤波信号通道数量,设计音频交互算法,计算训练最大似然度。在实验中对比四种语音交互系统的音频识别能力,实验数据显示,该系统音频数据识别准确率在五类音频信号中约为67%-97%,其他三种系统的识别准确率分别为62%-92%、66%-89%、67%-91%,由此可见该系统识别准确率高于这三种系统,基于MFCC系数的语音交互系统可以更好地处理与转换音频数据。  相似文献   

16.
引言:随着计算机计算能力的提升,如何让计算机更多的替代人类脑力资源,让计算机能具有学习能力变成了最为前沿的领域.这种计算机自我学习的方式被称为深度学习,而将深度学习与多媒体技术结合则是当前最有价值的研究领域之一.本文着重介绍了计算机基于卷积神经网络的深度学习在语音识别方面的价值与趋势分析.  相似文献   

17.
为提高公共场馆的讲解服务效率和趣味性,设计了一款语音交互导览机器人.该机器人采用科大讯飞AIUI新一代软硬件语音交互解决方案提升人机交互的智能化水平,机器人基于AGV磁导航和RFID射频识别技术实现自主定位导航,应用多种无线通信技术,解决机器人与场馆设备的通信控制问题,实现讲解过程中机器人与场馆设备的联动,使用STM3...  相似文献   

18.
为提高英语网络学习平台的资源调度性能,提升英语网络学习平台语音通信增强能力,提出基于人机智能交互的英语网络学习平台语音通信增强模型。采用高并发接入请求的资源分配方法进行语音通信的信道垂直切换处理,建立以网络拥塞度、用户数据传输速率为约束目标参量的英语网络学习平台语音通信优化控制模型,通过人工智能交互和自适应控制,结合多目标优化切换和解析,得出综合效益值,实现语音通信增强。实验得知,采用该方法进行英语网络学习平台语音通信增强处理,可提高通信稳定性,降低输出干扰,提高英语网络学习平台的资源自适应分配能力。  相似文献   

19.
口语语言理解(SLU)中的槽填充和意图识别任务通常是分别进行建模,忽略了任务之间的关联性。基于深度学习优势提出一种BLSTM-CNN-CRF学习框架,为槽填充和意图识别任务构建联合模型。双向长短期记忆网络(BLSTM)对全句的单词标签进行标注,卷积神经网络(CNN)用以提取全句的语义特征,条件随机场(CRF)通过解码单词标签与语义特征,获得全句的最佳序列标签。在航空旅行信息系统(ATIS)数据集上的实验表明,联合模型在不依赖于任何人工特征的情况下获得较高性能。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号