共查询到20条相似文献,搜索用时 630 毫秒
1.
针对立体声音频采集设备逐渐普及的趋势,本文提出了一种保留立体声相位信息的声音场景分类算法。在预处理阶段,根据左右通道的相位信息对音频样本进行源环境提取,生成一种全新的四通道特征。在此基础上,通过集成多个卷积神经网络,搭建一个针对立体声音频样本的声音场景分类系统。区别于现有声音场景分类系统只使用时频谱幅度信息,本文所提出的方法保留了立体声音频的相位信息。这使得声学特征中所包含的空间方位信息更丰富,立体声音频的优势得到发挥。实验结果证明保留立体声相位信息的声音场景分类系统具有更好的性能,在2019年IEEE声学信号处理技术委员会举办的声音场景分类赛事中相比于基线系统的识别准确率提升了18.3%。 相似文献
2.
3.
4.
姚兰 《电视字幕·特技与动画》2014,20(9)
广播艺术是一种基于声音的艺术,声音是广播之魂,一部好的广播作品需要在声音的处理上作精心的设计。本文以一部广播作品的录制为例,介绍了录制过程中人声、音响、音乐和场景的设计。 相似文献
5.
1.序言
很多年来,人耳是否能够探测出声音信号的相位失真一直是一个存在争论的话题。很多研究也试图去探测人耳是否能感知出声音的相位变化,可以确定的是,人耳在特定的情况下对声音相位的变化是比较敏感的。 相似文献
6.
7.
本文介绍了声学基础和人耳听觉特性,详尽阐述了在电视节目录制中,声音在频率补偿和混响方面的艺术处理。结合在我台600m^2演播厅录音、扩音的经验,对声音拾取和录音技巧做了详细介绍。 相似文献
8.
基本概念 人耳对声音强度反应的主观量称之为”响度“。响度是感觉判断声音的强弱,即声音响亮的程度。要明确这一概念.有必要先了解一下几个声音相关概念.以及传统的音频测量仪表. 相似文献
9.
本文在分析目前声讯业务不足之处的基础上,提出了用于Audiotex业务的,基于赵文思想的声音数据库的组织与管理方法,以及分类导引用户界面技术,并介绍了系统模型,组成及其功能。 相似文献
10.
声音编码与图像编码一样,采用数字压缩方法,降低声音信号中的冗余和丢掉声音信号中的不相关部分(凡不能被人耳感觉到的信号),使数字声音的信息量减少到最小程度,但同时又能精确地再现原始的声音信号。随着人们对声音特性和人耳特性的不断研究,声音编码技术得到很大的发展。下面先介绍人耳的听觉特性,接着介绍数字电视中的几种声音编码方法。1 人耳的听觉特性在人的听觉上,一个较强的声音的存在掩蔽了另一个较弱声音的存在,这就是人耳掩蔽效应。图1为掩蔽效应的原理图,a、b、c为同时存在的3个频率相近的声音,a声音最强,虚线以下表示是由… 相似文献
11.
基于PCA与Fisherface互补双特征提取的人耳图像识别 总被引:1,自引:0,他引:1
人耳识别目前是一种新的生物特征识别技术,特征提取是模式识别技术中的关键环节,决定着分类结果正确率的高低,单特征提取方法需要在一定的条件下才能取得较高的识别率,但是采用双特征提取却可以克服单特征提取的这一局限性.为了提高分类结果的正确率,提出了一个全新的方法,即基于主成分分析(PCA)与fisherface的互补双特征提取方法,并将其运用于人耳图像识别中,在北京科技大学提供的人耳图像库上的实验结果表明,该方法的人耳识别率明显高于PCA、fisherface、ICA单特征提取的人耳识别率. 相似文献
12.
一种基于飞机目标CFD图的目标特征提取算法研究 总被引:1,自引:0,他引:1
随着雷达目标微多普勒现象的发现,目标的微动特性在雷达自动目标识别中逐渐受到了广泛的关注。微动目标回波中包含了精细的目标微多普勒特征信息,因此,可以从其中推断出目标特有的独立特征。而基于目标微动回波时频图的特征更是因为其信息量充足的特点,成为了一种新兴有效的目标分类特征。文中主要研究了飞机目标的韵律频率图(Cadence Frequency Diagram,CFD)特征分类算法,详细叙述了算法的具体步骤。仿真分析了CFD特征在飞机目标分类中的特点和优势,并且研究了相关参数对CFD特征的影响。 相似文献
13.
Border monitoring plays a key role in the national defense. In this study, we applied the sound identification technology on the border monitoring, and assumed an ideal border monitoring sound target recognition system. Feature extraction is a crucial step in this recognition system. As the border sounds are of non-stationary signals, the traditional methods failed to extract such kind of features. Fortunately, wavelet packet transform (WPT) can provide an arbitrary time-frequency decomposition for the signals. Based on WPT, a novel feature extraction method using optimum wavelet packet decomposition (OWPD) was proposed. According to the characteristics analysis of the border monitoring sounds using WPT, the signals were analyzed by selective multi-scale wavelet packet decomposition (i.e. OWPD), and then we built the meaningful and compact energy feature vectors as the input vectors of the BP neural network, in order to recognize the border monitoring sound. Extensive experimental results showed that this feature extraction method has convincing recognition efficiency. 相似文献
14.
特征提取是合成孔径雷达目标识别关键技术与核心任务。为了更好地提取目标特征,稀疏约束将被添加在非负矩阵分解法中,并应用于图像目标特征提取,通过利用稀疏约束的非负矩阵分解方法对sAR目标图像进行分解,构建具有稀疏性的目标特征矢量,提高了特征矢量的类内相似性与类间差异性。利用基于支持向量机的分类方法对MSTAR数据进行目标识别试验,试验结果表明,添加稀疏约束的NMF方法与PCA、ICA以及一般NMF特征提取方法相比,能够显著提高目标识别的稳定性和准确率。 相似文献
15.
16.
介绍了图像目标识别技术中的图像分割,不变性参数提取和目标分类,利用图像目标的均匀性和相应知识自适应地分割和提取图像目标,被提取的每个图像目标的不变性参数由归一化过程和Zernike矩提取,并利用MPNN模型将图像目标分类,实验结果该识别系统能识别光照不均匀或复杂背景下的图像目标。 相似文献
17.
一种基于卷积神经网络的雷达目标分类方法 总被引:1,自引:0,他引:1
雷达作为对低空和地面目标探测及监视预警的主要手段,在安全领域应用广泛。针对现阶段实际应用中雷达目标分类技术中过于依赖人工提取特征的问题,提出了一种基于卷积神经网络的分类方法,对雷达回波数据进行二维傅里叶变换得到距离-多普勒图像,再以距离-多普勒图集作为数据集,训练神经网络,得到能够完成雷达目标识别的网络模型。结果表明,相较于传统方法,基于卷积神经网络的目标识别模型在省去人工工作的同时提高了目标识别精度。 相似文献
18.
John G. Harris Chiang-Jung Pu Jose C. Principe 《Analog Integrated Circuits and Signal Processing》2000,23(2):163-172
We describe the first single microphone sound localization system and its inspiration from theories of human monaural sound localization. Reflections and diffractions caused by the external ear (pinna) allow humans to estimate sound source elevations using only one ear. Our single microphone localization model relies on a specially shaped reflecting structure that serves the role of the pinna. Specially designed analog VLSI circuitry uses echo-time processing to localize the sound. A CMOS integrated circuit has been designed, fabricated, and successfully demonstrated on actual sounds. 相似文献
19.
20.
Huynh Q.Q. Cooper L.N. Intrator N. Shouval H. 《Signal Processing, IEEE Transactions on》1998,46(5):1202-1207
Underwater mammal sound classification is demonstrated using a novel application of wavelet time-frequency decomposition and feature extraction using a Bienenstock, Cooper, and Munro (1982) (BCM) unsupervised network. Different feature extraction methods and different wavelet representations are studied. The system achieves outstanding classification performance even when tested with mammal sounds recorded at very different locations (from those used for training). The improved results suggest that nonlinear feature extraction from wavelet representations outperforms different linear choices of basis functions 相似文献