首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
针对于当前语音信号的复杂性,和外界噪音的干扰,导致语音交互系统难以实现较为连续交互这一问题,采用由语音识别、单轮交互、多轮交互、语音合成这四个模块构成的基于语音识别的人机交互系统,在语音识别模块中,语音特征信号提取采用了MFCC特征提取方法,采用了深度算法进行构建声学模型。在多轮交互模块中,采用了GPT-2模型来实现了人机交互中的长对话。结果表明:该语音交互系统可以精准地提取出语音中的所需特征,然后进行有效的语音识别,DNN-HMM模型进行语音识别的WER值为4.11,识别时间短,最后合成出了清晰自然的语音。该结果证明此语音交互系统具有可行性。  相似文献   

2.
为提高智能语音交互机器人语音交互的准确率,提出一种基于意图识别的机器人智能英语语音交互方法。通过引入Glove_BiGRU_Self-attention分类预测模型构建意图识别功能模块,并采用ROS分布式架构对系统功能模块进行整合,实现人机的智能语音交互。仿真结果表明,采用所提方法进行的语音意图识别,具有更高的准确率,相较于基于DCNN模型、基于CNN-LSTM模型与基于单向构建的GRU-Self-attention模型的意图识别方法,识别准确率分别高出8.03%、4.07%和2.14%,具有更好的识别效果;在特征提取上,训练时间较传统基于BiLSTM模型的提取方法,BiGRU的训练时间缩短了4倍,训练效率更高。实验结果表明,采用所提意图识别方法搭建的语音交互系统,对用户英语语音指令的识别准确率和识别效率依然拥有较好的结果,识别平均准确率达到了89.72%,识别时间均在0.35 s之内,证明所提方法可以应用于实际语音交互之中。应用实验表明,采用基于意图识别方法搭建的智能语音交互机器人,无论是在问答交互还是控制命令上,都可以准确对用户英语指令进行识别,根据用户要求进行相关回答或完成相应动...  相似文献   

3.
现有的语音交互机器人多采用用户提问、机器人回答的单向交流方式,人机交互的智能性和灵活性较差。本文研究运用树莓派(Raspberry Pi)计算机和配套的语音板作为硬件载体,融合语音唤醒、语音识别、语音合成、自然语言处理等人工智能技术,调用科大讯飞开放云平台、在线图灵机器人,搭建一种基于云平台的智能语音交互机器人系统,并结合自主开发的本地知识库和问题库,使智能语音交互机器人能够根据不同环境与任务需求实现双向互动交流,实现由机器人采集信息和交流反馈,以提供高适应性的无接触人机语音交互服务。  相似文献   

4.
智能人机交互正作为一种新型沟通手段,逐渐走进人们的生活。近几年,语音技术逐渐改变人们的生活和工作方式。语音控制能实现交互高效、流畅、无缝,语音识别与合成技术是核心。笔者基于语音交互中的相关问题,提出Speech SDK平台残疾人辅助交互系统设计方案,有利于残障人士通过语音控制进行操作,希望通过探讨可以促进智能人机交互技术的推广应用。  相似文献   

5.
利用语音命令实现与智能设备的交互已经成为现代控制理论研究的热门话题之一。介绍了一种基于数字信号处理器(DSP)、语音采集模块、无线收发模块、片上外设等资源实现的语音命令控制处理系统。该系统首先通过语音采集模块采集到语音控制信号;然后通过DSP和相应的片上外设实现对语音命令的识别;最后将识别的语音命令传递给无线收发模块以实现对于智能设备的控制。整个系统的设计应用领域广泛,可以为人机交互提供一种切实可行的参考方案。  相似文献   

6.
本文设计并实现了一种服务机器人系统,采用嵌入式系统,传感器阵列,语音识别与语音合成技术、无线数据通信技术,能够完成人脸跟踪、语音交互、自主移动、动作响应、远程遥控.实际实验表明,该机器人能够和人进行自然的交互,可以为人类提供一定的机器人服务功能.  相似文献   

7.
针对中国逐渐步入老龄化时代,传统交互方式的物联网系统操作繁杂、不够人性化的问题,提出了一种基于语音识别和物联网技术智能融合的新型物联网系统。首先,通过引入内置处理器的语音识别模块,不仅实现了传统语音识别,还实现了语音的云端传输,突破了主控芯片的计算能力和储存能力低的瓶颈;然后,利用物联网技术把复杂的算法置换到云端去执行,在语音识别方面有质的变化,结合云端分布式储存的特点,能够分门别类地建立用户的语音数据库,在用户习惯学习时提供大量的数据基础;最后,根据大量的数据基础,逐渐通过学习能力建立属于用户个人的语音识别库。通过实验对所提出的智能融合式物联网系统在语音识别的准确度、计算能力、语音交互的智能化程度等方面进行了有效性验证。实验结果表明,在语音识别精度方面随着距离增加至10 m以上,所提系统的准确度仍可达到70%以上,语音数据计算能力方面提高了31倍,同时在语音交互的智能化程度方面性能更优。该系统为老年人使用物联网交互提供了便利。  相似文献   

8.
针对传统的交互设备以机器为中心而不是以人为中心这一现状,提出一种利用计算机视觉通道与语音通道整合进行头部交互动作方向识别来控制媒体播放器的系统.结合图像处理技术和模式识别理论,将人体头部头发分布这一线索作为先验知识,利用对称性和分布概率来识别交互方向,并分别控制播放器的各种行为,如快进、后退等.实验结果表明,该方法实现简单,识别率较高,并容易移植到现实生活当中的智能家电中,从而实现一种自然和谐的人与机器的交互.  相似文献   

9.
末端派送是快递服务的关键一环,本文设计和实现了一款基于Android的智能派件系统,采用科大讯飞API+百度地图API实现信息的可视化与语音交互的智能化。快递员可以通过该系统的快递信息可视化、智能语音交互、智能路径规划和导航等功能,提高其派送效率。  相似文献   

10.
语音在日常生活中承载着信息传递的重要功能,随着深度学习技术的发展,语音识别的准确率得到极大的提高,推动了语音识别技术走向实际应用。介绍语音识别技术的发展情况和基本原理,分析北京市河长制管理信息系统中巡查人员记录问题和社会公众投诉举报过程中的不便之处,提出利用语音识别技术构建北京市河长制智能语音交互系统。介绍该系统的总体架构,阐述智能语音交互技术在移动App和微信公众号中的应用设计,针对河长制具体应用场景提出相应的语音识别准确率提升方案。通过将智能语音识别技术应用到北京市河长制管理工作,提高各级河长和巡查人员工作效率,促进社会公众参与河湖治理,不断提升河长制工作精细化和科学化水平。  相似文献   

11.
智能语音技术包含语音识别、自然语言处理、语音合成三个方面的内容,其中语音识别是实现人机交互的关键技术,识别系统通常需要建立声学模型和语言模型。神经网络的兴起使声学模型数量急剧增加,基于神经网络的声学模型与传统识别模型相结合的方式,极大地推动了语音识别的发展。语音识别作为人机交互的前端,具有许多研究方向,文中着重对语音识别任务中的文本识别、说话人识别、情绪识别三个方向的声学模型研究现状进行归纳总结,尽可能对语音识别技术的演化进行细致介绍,为以后的相关研究提供有价值的参考。同时对目前语音识别的主流方法进行概括比较,介绍了端到端的语音识别模型的优势,并对发展趋势进行分析展望,最后提出当前语音识别任务中面临的挑战。  相似文献   

12.
We analyze the range of problems that arise in the development of information and reference robots. A model of intelligent direction of a mobile information system on the basis of multimodal interface, providing natural man-machine interaction, is suggested. A set of web-cameras, an array of microphones, and remote sensing technology for speech recognition and human face tracking are used for the user position and the speech request determination.  相似文献   

13.
语音识别是人机交互模式识别领域的一个重要课题,构建了一种基于深度神经网络的语音识别系统,使用了抗噪对比散度法和抗噪最小平方误差法对模型进行无监督训练;使用了均值归一化进行模型优化, 提高了网络对训练集的拟合度,并且降低了语音识别的错误率;使用多状态激活函数进行了模型优化,这不仅使得不带噪测试和带噪声测试的语音识别错误率进一步下降,并能在一定程度上减轻过拟合现象;并通过奇异值分解和重构的方法对模型进行了降维。实验结果表明,此系统可以在不影响语音识别错误率的基础上极大地降低系统的复杂性。  相似文献   

14.
基于语音识别的汉语发音自动评分系统的设计与实现   总被引:6,自引:0,他引:6  
语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程.介绍了系统实现中的关键技术和步骤:动态时间弯折算法、语料库的建立、声韵分割技术以及评价分级标准.通过小范围的试验,表明该系统对留学生汉语发音水平的测试有一定的参考价值.  相似文献   

15.
针对语音识别系统对抗环境噪声的实际需求,提出一种二次组合抗噪技术,研究并设计了一种以数字信号处理器(DSP)为硬件平台,以隐马尔可夫模型(HMM)为算法的抗噪声嵌入式语音识别系统.DSP采用型号为TMS320VC5509A的芯片,配以外围硬件电路构成语音识别系统的硬件平台.软件设计以离散隐马尔可夫模型(DHMM)为识别算法进行编程,系统软件主要有识别、训练、学习和USB四个主要模块.实验结果表明:基于二次组合去噪技术的语音识别系统有更好的抗噪声效果.  相似文献   

16.
关勇  李鹏  刘文举  徐波 《自动化学报》2009,35(4):410-416
传统抗噪算法无法解决人声背景下语音识别(Automatic speech recognition, ASR)系统的鲁棒性问题. 本文提出了一种基于计算听觉场景分析(Computational auditory scene analysis, CASA)和语者模型信息的混合语音分离系统. 该系统在CASA框架下, 利用语者模型信息和因子最大矢量量化(Factorial-max vector quantization, MAXVQ)方法进行实值掩码估计, 实现了两语者混合语音中有效地分离出目标说话人语音的目标, 从而为ASR系统提供了鲁棒的识别前端. 在语音分离挑战(Speech separation challenge, SSC)数据集上的评估表明, 相比基线系统, 本文所提出的系统的语音识别正确率提高了15.68%. 相关的实验结果也验证了本文提出的多语者识别和实值掩码估计的有效性.  相似文献   

17.
面向虚实融合的人机交互涉及计算机科学、认知心理学、人机工程学、多媒体技术和虚拟现实等领域,旨在提高人机交互的效率,同时响应人类认知与情感的需求,在办公教育、机器人和虚拟/增强现实设备中都有广泛应用。本文从人机交互涉及感知计算、人与机器人交互及协同、个性化人机对话和数据可视化等4个维度系统阐述面向虚实融合人机交互的发展现状。对国内外研究现状进行对比,展望未来的发展趋势。本文认为兼具可迁移与个性化的感知计算、具备用户行为深度理解的人机协同、用户自适应的对话系统等是本领域的重要研究方向。  相似文献   

18.
为了提高情感识别的准确性,该文以语音信号为研究对象,提出了一种新型的语音情感识别方法.将局部保持投影算法(LPP)的思想融入到主元分析(PCA)的目标函数中,使得在原始变量空间投影到低维空间的过程中,不仅实现了整体方差的最大化,而且保持了局部近邻结构不变,有利于全局和局部特征的全面提取,克服了传统PCA方法只关注全局结构特征而忽略局部特征的缺陷.对比实验结果验证了该方法的可行性和有效性,实现了对喜悦、愤怒、悲伤、恐惧和中性5种人类基本情感的识别,研究成果将为情感识别提供新的研究方法,促进人机交互系统进一步深入发展.  相似文献   

19.
人工智能技术是当前计算机科学的研究热点,人机通信是人工智能技术的重要组成之一。作为人机通信主要方法之一的语音交互也一直是科学家的研究热点,语音交互技术的关键是语音识别。而目前大多语音识别软件要么功能单一,要么价格昂贵,Kaldi作为新兴的开源语音识别工具,凭借其强大的功能和简单的获取渠道逐渐流行。该文介绍了语音识别技术的发展历程,Kadli软件的基本架构和其所具有的独特优势,语音识别的一般处理流程,多层神经网络的基本结构以及多层神经网络在语音识别当中的应用。对基于Kaldi软件当中的HMM-DNN模型,使用中文数据集训练该模型,搭建一个完整的语音识别系统。通过该系统,不仅能展现出Kaldi软件丰富强大的功能,同时也为语音识别研究人员选择合适的工具提供了新的思路。  相似文献   

20.
为实现自然语音纠错,提升自然语音识别与拼读的正确率,研究人工智能技术在自然语音纠错与反馈系统设计中的应用。设计由前端学习单元与后端支撑单元组成的自然语音纠错与反馈系统,预处理采集到的自然语音片段,基于片段间距离划分因素,提取自然语音片段特征,采用隐马尔可夫模型识别自然语音,基于B2规范语料,采用动态时间归整方法纠错与评分识别到的自然语音,通过反馈模块将识别、纠错、评分结果反馈给用户。对比实验的结果表明,设计的自然语音纠错与反馈系统的语音识别率高于95%,纠错结果与实际错误一致,可提升自然语音拼读的正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号