共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
本文提出了一种录音设备的建模和识别算法.在特征选择方面,考虑到音频段中的静音包含了与正常语音一样的设备信息,并且不受说话人、文本、情感等因素的影响,因此从静音段中提取出表征录音设备“机器指纹”的特征,并用谱减法去除其中的背景噪声.在识别模型方面,利用设备通用背景模型构建反对设备模型;在设备通用背景模型的基础上,利用少量的特定设备数据,通过MAP自适应算法获得相应录音设备的模型.最后通过归—化似然度得分对输入的特定录音设备的语音样本进行分类判决.实验结果表明,对于9种不同录音设备的平均正确识别率为87.42%,并考察了不同因素对本文算法的影响,验证了本文算法的有效性和可靠性. 相似文献
3.
作为一种感知周围环境十分有效的方法,环境声音识别(Environment Sound Recognition,ESR)被广泛地应用在机器人导航、移动机器人、音频检索、音频取证以及其它基于情景感知、可穿戴的应用中.目前,较为简单的分类器已经大规模应用在ESR问题中,但却不能很好地反映和识别环境声音,而深度神经网络作为一种高性能、多层的神经网络,为更好地描述原始数据特征和解决模式识别问题提供了更有效的途径.为此,本文将深度神经网络应用在环境声音识别问题中,并对音频特征进行特征融合,通过训练深度信念网络(Deep Belief Network,DBN)进行环境场景的识别.实验结果表明,基于特征融合的方法的识别性能相较于分别采用音频特征的方法识别在性能上有明显提升,且将深度学习应用在ESR问题中具有明显的优势. 相似文献
4.
5.
本文设计了一种基于卷积神经网络的放电声音检测方法,针对电力系统中设备绝缘老化引起的局部放电现象,提出通过终端边缘节点的声信号检测方法实时监控设备正常工作、局部放电和发生故障的三种状态,并将异常状态通过边缘计算专网反馈给运维中心。该系统通过设备终端的边缘节点采集发生故障时放电音频数据,这些故障包括:正常工作、局部放电和故障已发生的状态。并进行信号预处理和提取能够反应故障状态的音频特征。然后,将处理后的数据作为卷积神经网络的输入。实验表明该方法与经典的深度神经网络相比,平均识别率提高了约2%。 相似文献
6.
录音设备来源识别是通过分析已获取的数字语音信号从而确定其录制设备的一种技术,属于数字音频盲取证.本文提出了一种基于改进PNCC特征和两步区分性训练的录音设备识别方法,由于音频中的静音包含了完整的设备信息,且不受说话人和文本等因素的影响,因此从静音段提取改进的PNCC特征,利用了PNCC的长时帧分析去除背景噪声对设备信息的影响.在模型方面,以GMM-UBM为基准模型,并通过两步区分性训练调整集内设备模型和通用背景模型,提升模型区分能力.该方法对于30种设备闭集识别的平均正确识别率为90.23%;对于15个集内和15个集外设备的测试,等错误率为15.17%,集内平均正确识别率为96.65%,验证了本文算法的有效性. 相似文献
7.
D8嵌入式固态录音机既是一款功能强大的录音设备,也是一款灵活、高效的音频播放设备,是专门针对电台演播室、录音棚(间)应用需求,满足高质量节目录音和播放需求而研发的新型录音设备。 相似文献
8.
作者凭借其丰富的录音工作经验及对数字化时设备的掌握理解,结合实际叙述了在广播剧的前期录音、不同场景中声效的处理及广播剧后期编辑制作中,如何运用数字调声台、数字混响器及数字化音频工作站等数字化设备来获得满意效果的。 相似文献
9.
本文对基于DRA/DRA+音频压缩算法建设和应用的音频同步传输系统进行了介绍,详细阐述了基于自主研发的DRA/DRA+音频同步编解码器为核心设备,建设的多个音频同步传输系统应用,并对系统建设后在广播传输、覆盖系统中的实际应用项目进行了阐述和分析。最后对基于DRA/DRA+的音频同步传输技术的推广应用的发展前景做了展望。 相似文献
10.
上世纪70~80年代音响放大器的前级发展到了鼎盛时期,为了兼容当时五花八门的音频信号的重放,前级的电路越来越复杂。在数字光学录音出世以前,音频信号的声电转换、传输采用多种不同的软件和相应的重播设备,使其各有不同的输出特性,仅信号电平可从1mV以下到最大近1V,输出阻抗可从几Ω到几百kΩ。重放频率范围虽为音频,但各种录音、传输设备为了改善重放效果,都采用不同的录音频率特性电路予以校正,在重放中还原,则放音过程必须采取与录音相反的校正特性。 相似文献