首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
语音欺骗是指通过录音、语音合成(Text-to-speech, TTS)、语音转换(Voice conversion, VC)等手段,将一段非法的、未经过自动说话人验证(Automatic speaker verification, ASV)系统认证的声音进行“修改仿冒”,以达到通过ASV系统检测的目的。随着人工智能和语音欺骗技术的发展,ASV系统在安全性方面遇到了严峻的挑战。检测输入ASV系统的语音的真实性,防止欺骗语音通过ASV的验证以提高ASV系统的安全性,是近年来语音领域研究的一个热点问题。国内外学者的最新研究从声学特征选取、识别模型选择等角度出发,探索了不同的语音欺骗方法对ASV系统的影响,并深入研究了相应的语音欺骗检测技术,在一定程度上提高了ASV系统的防欺骗性能。本文介绍了语音欺骗的基本方法,给出了语音欺骗检测的框架和典型声学特征,分两大类别总结了语音欺骗检测的主要方法和最新进展,梳理了目前语音欺骗检测中仍然存在的若干技术问题,并对语音欺骗检测技术的发展方向进行了展望。  相似文献   

2.
利用人工智能技术和深度学习算法,设计开发了基于AI+IOT的智慧家居系统。基于百度提供的免费的语音识别云平台,该系统使用ZigBee网络,对家居环境数据进行采集、分析,并通过物联网技术和人工智能技术实现远程语音控制各种家电的功能。基于深度学习,系统通过百度语音识别技术对自然语言进行语音识别,通过搭建系统编译环境成功融合了AI技术和IOT技术实现了具有语音控制功能的智能家居系统,致力于为人们提供更加便捷智能的生活。  相似文献   

3.
针对多机协同对海突击对无线语音通信仿真需求,分析了无线语音通信仿真系统的功能需求,并设计了系统逻辑结构,给出了语音服务器和语音客户端的设计思路与实现方法,并采用面向对象技术封装了语音通信类库,实现了语音的多点、全双工实时传输以及通话权限的控制。应用表明,该系统较好地体现了语音通信距离、语音通信频段、语音通信干扰、语音数据的分发、语音数据回放等效果,提高了系统仿真的逼真性、交互性、对抗性和可信性,具有较强的实用性。  相似文献   

4.
《传感器与微系统》2019,(5):100-103
针对传统语音软件包信息冗余且移动机器人控制系统通用性和代码可移植性差的问题,提出了一种基于机器人操作系统(ROS)的移动机器人语音控制系统。语音控制命令信号经预加重、加窗分帧以及端点检测等进行预处理,利用基于Fisher比的Bark小波包变换方法提取特征参数,应用隐马尔可夫模型(HMM)算法进行识别,应用C++语言将上述内容编写成软件包,使用ROS的节点功能以及通信机制将识别结果用来控制移动机器人运动。实验结果表明:系统的识别率为94%以上,能准确识别不同用户的语音控制命令;经与成熟SDK功能比较,系统的识别率提高了1. 6%,且识别时间明显缩短,仅为255. 6 ms,表明系统在确保准确率的同时提高了反应速度。  相似文献   

5.
张勇  曲军  耿欣 《微机发展》2004,14(6):40-41
台湾技电企业有限公司生产的VP1606语音芯片是采用先进技术加工的大规模集成电路。文中介绍了VP1606语音芯片的特性和功能以及利用该语音芯片实现环保设备远程智能监视仪的方法。讨论了单片机与该语音芯片的接口电路设计方法以及软件控制的方法,实现了单片机控制的语音系统,较好地解决了利用语音远程传送工业现场实时工况信息的问题。系统结构简单、传送速率高、工作可靠、使用方便,可以推广应用到各种应用语音的控制系统中。  相似文献   

6.
介绍了一种用语音识别技术进行无线控制的设计方案.采用TLV320AIC23为语音信号的AD转换器,TI的TMS320VC5509ADSP为语音识别的核心处理器,配以FLASH、SDRAM等储存芯片和FPGA做10扩展和逻辑控制.在语音成功识别后由无线通讯模块(nRF402)发送特定编码:接收端收到信号后,经解码实现相应控制.  相似文献   

7.
语音应答服务系统Air Voice设计与实现   总被引:1,自引:0,他引:1  
本文介绍基于PC/MODEM的PSTN语音应答服务系统Air Voice,对Air Voice系统的功能、结构以及实现语音应答服务的关键技术进行了说明,重点讨论了利用调制解调芯片CLMD1414UNT和VB串行通信控件MsComm实现PSTN语音通信控制的技术实现方法,并阐述了语音合成技术在系统中的应用。  相似文献   

8.
本文介绍基于PC/MODEM的PSTN语音应答服务系统AriVoice,对AirVoice系统的功能、结构以及实现语音应答服务的关键技术进行了说明,重点讨论了利用调制解调芯片CLMD1414UNT和VB串行通信控件MsComm实现PSTN语音通信控制的技术实现方法,并阐述了语音合成技术在系统中的应用。  相似文献   

9.
噪声鲁棒语音识别研究综述*   总被引:3,自引:1,他引:2  
针对噪声环境下的语音识别问题,对现有的噪声鲁棒语音识别技术进行讨论,阐述了噪声鲁棒语音识别研究的主要问题,并根据语音识别系统的构成将噪声鲁棒语音识别技术按照信号空间、特征空间和模型空间进行分类总结,分析了各种鲁棒语音识别技术的特点、实现,以及在语音识别中的应用。最后展望了进一步的研究方向。  相似文献   

10.
台湾技电企业有限公司生产的VP1606 语音芯片是采用先进技术加工的大规模集成电路.文中介绍了VP1606语音芯片的特性和功能以及利用该语音芯片实现环保设备远程智能监视仪的方法.讨论了单片机与该语音芯片的接口电路设计方法以及软件控制的方法,实现了单片机控制的语音系统,较好地解决了利用语音远程传送工业现场实时工况信息的问题.系统结构简单、传送速率高、工作可靠、使用方便,可以推广应用到各种应用语音的控制系统中.  相似文献   

11.
宿翀  李宏光 《自动化学报》2013,39(5):617-625
当今大量的工业过程控制工程问题, 如控制性能评价等的多目标决策问题通过人机交互得到解决. 然而, 在使用传统的交互式进化计算方法求解多目标决策问题时, 表现为局部搜索能力不强和过度依赖决策人员的主观意图. 本文提出一种新的情感计算方法和人机交互学习机制的解决方案. 提出一类基于刺激响应的情感计算模型(STAM), 并给出了情感空间和人的主观偏好之间的定量关系. 此外, 基于遗传算法框架, 建立情感交互学习策略, 旨在决策过程中逐步掌握人员的主观偏好, 降低人的疲劳程度, 使决策更加客观和科学. 附录A和B分别展示了情感学习算法的复杂度和收敛性分析. 为验证所提方法的正确性, 以测试函数及单回路反馈控制的PID参数整定问题进行研究, 得到了满意的结果, 验证了所提方法的可靠性与有效性.  相似文献   

12.
基于表面肌电的运动意图识别方法研究及应用综述   总被引:10,自引:0,他引:10  
表面肌电信号 (Surface electromyography, sEMG) 是人体自身的资源, 蕴含着关联人体运动的丰富信息, 用它作为交互媒介以构建人机交互 (Human-robot interaction, HRI) 系统有天然的优势.通过肌电信号实现人机自然交互的关键是由肌电信号识别出人体运动意图, 通常包括离散动作模态分类、关节连续运动量估计及关节刚度/阻抗估计等三方面内容.本文详细归纳基于表面肌电的运动识别方法研究成果, 总结当前研究的特点; 随后, 介绍基于表面肌电的运动识别技术的应用现状, 并探讨制约其推广的主要问题; 最后, 展望该技术的未来发展.  相似文献   

13.
心电检测技术及其在远程医疗中的应用   总被引:2,自引:0,他引:2  
心血管疾病是威胁人类生命的主要疾病之一,心电图(ECG)则是评价心脏功能的主要依据,关于心电信号检测技术的研究一直为各方所关注。综述了ECG的基础理论、检测技术及其在远程医疗中的应用,并对心电信号检测技术的发展趋势作了展望。  相似文献   

14.
脑控: 基于脑——机接口的人机融合控制   总被引:5,自引:1,他引:4  
王行愚  金晶  张宇  王蓓 《自动化学报》2013,39(3):208-221
近年来,一类被称之为脑控的新型控制系统发展迅速, 这是一种基于脑--机接口(Brain-computer interface, BCI)的人机融合控制系统, 也是一种基于人的意念和思维的控制系统. 脑控系统已被成功应用于残疾人的生活辅助、中风病人和损伤肢体的康复训练、 操作员状态的实时监控、游戏娱乐和智能家居等广泛的领域. 本文在简要介绍了脑控的研究背景、基本原理、系统结构和发展概况的基础上, 着重对脑电信号(Electroencephalogram, EEG)模式、控制信号转换算法和应用系统研究等主要问题的研究现状, 进行了较为详细的论述和分析, 并探讨了进一步研究的方向和思路. 最后对脑控的未来发展方向和应用前景进行了分析和展望.  相似文献   

15.
提出了一种基于姿态反馈的球面并联机构闭环控制方法,有效地解决了该机构输入与输出之间复杂的3维非线性强耦合映射关系给构建闭环系统带来的问题.同时将球面并联机构应用到机器人眼设计上,制作了类似人眼运动特点、比人眼尺寸略大、具有控制和视频信号接口的仿生眼实物;基于数字信号处理器(DSP)的控制系统实现了逆解和闭环控制算法的实...  相似文献   

16.
维吾尔语连续语音识别技术研究   总被引:1,自引:0,他引:1  
维吾尔语连续语音识别技术研究主要阐述维吾尔语连续语音的识别技术.主要包括声学模型和语言模趋。在声学模型中,主要介绍基于隐马尔可夫模型(Hidden Markov Model,HMM)的维吾尔语筵续语音识别声学建模。在语言模型中,主要对比基于文法和基于统计这两种方法的优劣。  相似文献   

17.
基于D3D的三维虚拟人运动显示   总被引:1,自引:1,他引:1  
开发了一套基于Direct 3D技术的应用程序开发包DXVHSDK,它可以在虚拟环境中载入、驱动并显示一个或多个三维虚拟人,具有绘制速度快、可靠性高、可扩展性强等优点,能够灵活地驱动虚拟角色完成各种复杂的运动和操作,可以广泛应用于仿真、娱乐、智能人机交互等领域.在DXVHSDK的基础上,还开发了一个可以控制虚拟人运动的原型系统.  相似文献   

18.
随着无线传输、机器学习、人工智能等技术的进步,基于脑电图(EEG)的脑机接口(BCI)技术的研究相应增加,作为一种变革性的通讯和控制技术,脑机接口可以广泛地应用于康复医疗、游戏娱乐、军事应用、家居智能等领域,具备千亿级别的应用市场;综述了基于EEG的典型脑机接口范式,包括MI-BCI、P300-BCI、SSVEP-BCI等范式的基本原理、研究现状和典型应用场景,对各类范式的优缺点进行了评价,提出了当前研究中面临的技术和伦理等方面的风险挑战,并对其发展和应用前景作了展望。  相似文献   

19.
以层树分集(SPIHT)编码方案为基础,结合人类视觉系统(HVS)模型和人类视觉对彩色图像分量亮度和色度的不同敏感性,提出了一种基于非对称编码和交叉掩蔽的小波域彩色图像压缩编码算法。该算法首先将原始图像从RGB空间转换到YCbCr空间,然后对YCbCr空间的各分量进行离散小波变换;之后根据人类视觉对彩色图像的亮度分量的敏感性,用交叉掩蔽模型对亮度分量的小波系数进行加权处理;与此同时,利用非对称编码和SPIHT编码思想完成图像的压缩。仿真实验结果表明,文中算法是一种高效的图像压缩编码方法,其压缩效果明显优于SPIHT编码方案。  相似文献   

20.
虚拟人实时运动控制的研究   总被引:7,自引:0,他引:7  
为在虚拟环境中再现逼真的人体运动,对虚拟人的实时运动控制进行了研究。简单阐述了对虚拟人体的几何建模和运动建模。在传统人体动画控制技术的基础上,提出了虚拟人行为的高、低两层控制策略,实现了虚拟人行为的智能化--在低层运动控制部分,通过关键帧,正向、逆向运动学和简单动力学适当结合的多重控制技术对人体的关节直接控制,实现了周期地步行、跑步等移动动作;在高层运动控制中,研究了避免碰撞障碍物的路径规划和接近  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号