共查询到20条相似文献,搜索用时 15 毫秒
1.
2006年4月20日,中国科学院声学研究所发布了音频信号处理及人机互动界面语音处理的重要技术突破。同时声学所与其转投资子公司中科信利分别与富迪科技形成结盟,携手开发先进技术,结合双方资源开拓应用市场。双方的技术及应用结盟将为音频及语音信号处理及识别技术注入新鲜血液,带动信息产业价值链发展与蓬勃商机。 相似文献
2.
成本、口音、智能和噪音曾被人们认为是语音技术应用中的四大难题,然而不久前中科院声学所与香港富迪科技的一次合作为解决语音技术应用难题开创了新的思路。4月20日,中国科学院声学研究所发布了在通信声学领域取得的重要技术成果,尤其是在音频信号处理及人机互动界面语音处理等方面获得重要技术突破。当天声学所与其转投资子公司中科信利分别与富迪科技达成战略合作协议,携手开发先进技术,结合双方资源开拓应用市场。中科院声学所对音频及语音信号处理发表的最新技术包括语音信号的检测、增强,智能声场控制和音频回放技术;人机互动技术包括… 相似文献
3.
前不久,中国科学院声学研究所就音频信号处理及人机互动界面语音处理技术方面取得突破。近日,声学所与其转投资子公司北京中科信利技术有限公司与富迪科技(Fonemedia Inc.)结盟,结合双方资源共同开发先进的语言合成技术,开拓新的应用市场。据中科院声学所所长田静介绍,中科院声学所对音频及语音信号处理发表的最新技术,包括语音信号的检测、增强,智能声场控制和音频回放技术;人机互动技术包括语音输入处理和音频内容检索。声学所与富迪科技的合作以通信、网络、家电、手机等语音应用为目标,结合双方所长,加速嵌入式音频处理芯片 相似文献
4.
5.
6.
7.
8.
9.
音频测试针对的是终端与人之间的接口.通过对电学和声学信号进行分析的基础上进行基于仪器的测试,目前音频测试方法仍在不断发展中。本文主要探讨目前我国手机终端音频领域对语音质量的最新要求及相关测试。 相似文献
10.
11.
12.
13.
文章主要探讨电声技术在人工智能语音识别中的应用和挑战,并给出相关优化策略。麦克风、扬声器、音频处理以及声学模型等电声技术对提升语音识别系统的性能具有重要意义,但噪声干扰、硬件限制、识别准确性及实时处理能力仍是技术发展的难题。通过精细调整声学模型、对硬件性能进行升级、使用先进的噪声抑制算法以及加速系统处理等措施,能够有效提高人工智能语音识别的性能。 相似文献
14.
声学工程和音响工程在当今的娱乐和媒体产业中扮演着重要角色。因此,探讨声学工程和音响工程中打造沉浸式音频体验的关键要素,以期为相关领域的研究和实践提供参考。介绍声学工程和音响工程的重要性,探讨声学工程和音响工程的关键要素,以更好地利用声学工程和音响工程的原理和方法打造沉浸式音频体验,总结这些要素对沉浸式音频体验的重要性,展望其未来的发展。 相似文献
15.
16.
汉语语音识别研究面临的一些科学问题 总被引:12,自引:0,他引:12
本文简述汉语语音自动识别从实验室技术过渡到实际商用技术所必须解决的一些科学问题,列举了汉语语音编码的结构特点和规则,强调(1)在汉语音节的声母、韵母层面上的语言模型对语音的识别很有帮助,也会提供文字语言和讲话语言的有用知识;(2)使用区别性导引特征和描述性均匀特征有助于加速语音识别的搜索速度,减少失配和改善对音位变体的细分,本文还着重讨论了在语音信号的声学处理环节提高语音识别鲁棒性的重要问题和途径,文中还提出了标注性学习、提示性猜测的逐步过渡的训练和自适应方法,用于汉语大词汇连续语音识别。 相似文献
17.
丹拿声学(Dynaudio Acoustics)AIR系列监听扬声器 总被引:1,自引:1,他引:0
北京唯安奥德科技有限公司 《电声技术》2005,(9):74-75
目前的音频系统并未做到真正的全数字化,尤其是整个系统的最前端信号采集部分和最末端的监听部分。前端信号采集部分是指传声器的输入部分,采用数字方式采集音频信号几乎是不可能的;而末端的监听部分则是指监听扬声器的数字化,即数字扬声器。丹拿声学的AIR系列监听扬声器解决了监听系统数字化的问题,作为丹拿声学扬声器技术与TC.Electronic数字技术结合的产物,采用了数字功放的AIR是一款真正的数字扬声器。 相似文献
18.
提出了一种基于声学心理模型和小波包变换的的音频水印算法,适用于立体声音频信号和单声道音频信号。对于立体声音频信号,在左右声道加入不同的水印信号;对于单声道音频信号,在奇偶帧加入不同的水印信号。左声道水印通过源信号包络与一个只有版权拥有者持有的随机序列加权生成水印信号,并且通过对得出信号进行小波包和声学心理模型分析控制水印信号的强度;右声道水印信号为幅度限制在可听门限的白噪声,用来控制检测门限。得到的水印信号在时域嵌入,水印的检测无需原文件。该方法能够将检测门限控制在事先设定的范围内,具有较好的隐秘性;嵌入的水印信号能够抵抗时域的切割、加噪攻击和一般的音频变换算法。 相似文献
19.
随着人工智能(Artificial Intelligence,AI)技术的迅猛发展,音频信号处理成为引人瞩目的研究领域。在应用现状方面,它主要聚焦于自适应音频分析与语音识别、音频合成与音乐创作、高级音频增强技术的创新以及实时音频处理与自动化应用的前沿。然而,这一领域也面临着数据隐私和伦理挑战,在解决挑战的过程中,研究提出独特且具有前瞻性的策略。面向多领域数据的跨模态学习与迁移学习,强调强化学习和元学习在实时音频处理中的应用,提出将可解释的深度学习模型与隐私保护技术融合。策略的提出不仅为音频信号处理领域的未来发展指明了方向,也为AI在其他领域的应用提供了有益借鉴。 相似文献
20.
这里提供了2002年至2003年8月期间颁布的声学(见表1)、电声学(见表2)、音视频和多媒体(见表3)等国际标准的进展情况。“声学”是ISO/TC43的内容,国内归口SAC犤犦/TC17“全国声学标准化技术委员会”,秘书处设在中国科学院声学研究所,它涉及听觉、噪声和建声,同电声学是相邻的学科。“电声学”是IEC/TC29的范围,国内归口SAC/TC23“全国电声学标准化技术委员会”,秘书处设在中国电子科技集团公司第三研究所。“音频、视频和多媒体”的音频部分是IEC/TC100的内容,国内归口SAC/TC242“全国音频、视频和多媒体标准化委员会”,秘书处设… 相似文献