首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 630 毫秒
1.
杨浩聪  史创  李会勇 《信号处理》2020,36(6):871-878
针对立体声音频采集设备逐渐普及的趋势,本文提出了一种保留立体声相位信息的声音场景分类算法。在预处理阶段,根据左右通道的相位信息对音频样本进行源环境提取,生成一种全新的四通道特征。在此基础上,通过集成多个卷积神经网络,搭建一个针对立体声音频样本的声音场景分类系统。区别于现有声音场景分类系统只使用时频谱幅度信息,本文所提出的方法保留了立体声音频的相位信息。这使得声学特征中所包含的空间方位信息更丰富,立体声音频的优势得到发挥。实验结果证明保留立体声相位信息的声音场景分类系统具有更好的性能,在2019年IEEE声学信号处理技术委员会举办的声音场景分类赛事中相比于基线系统的识别准确率提升了18.3%。   相似文献   

2.
源-目标话者的声音转换是一种变换说话人声音特性的技术,它将源说话人的声音转换成另一个指定的目标说话人的声音.对源话者声道谱特性的修改是声音转换的关键之一.为了克服一般分类线性转换算法中分类不准确所带来的误差,本文引入了分类线性加权转换的策略,根据不同子类的转换函数对谱特性的贡献,赋予不同的加权系数,给出了一种基于GMM后验概率加权的线性转换算法.在微软汉语普通话语音数据库上做的四组对比实验表明,该算法在谱转换性能上均有不同程度的提高.  相似文献   

3.
基于仿生小波的阈值语音增强算法   总被引:1,自引:0,他引:1  
人耳对于声音信号的分辨率是非线性的,而仿生小波变换正是由非线性的耳蜗听觉模型发展而来。文章提出一种基于仿生小波变换的语音信号去噪方法,同时针对软硬阈值函数的不足,采用一种修正的硬阈值函数进行处理。仿真结果表明,该方法具有较好的增强效果。  相似文献   

4.
广播艺术是一种基于声音的艺术,声音是广播之魂,一部好的广播作品需要在声音的处理上作精心的设计。本文以一部广播作品的录制为例,介绍了录制过程中人声、音响、音乐和场景的设计。  相似文献   

5.
1.序言 很多年来,人耳是否能够探测出声音信号的相位失真一直是一个存在争论的话题。很多研究也试图去探测人耳是否能感知出声音的相位变化,可以确定的是,人耳在特定的情况下对声音相位的变化是比较敏感的。  相似文献   

6.
环境声音包含丰富的信息,通过声音识别可以快速判断异常信息,从而为异常确认、快速处理争取时间。给出了一种基于FPGA+ADC的声音报警系统,模拟采集由语音芯片XX73311完成,数据传输由太网PHY电路XX83848实现。系统可高质量完成模拟量到数字量的转换,并以短时能量端点检测、特征参数提取为基础训练样本,以声音识别技术完成异常声音判断,实现异常报警。试验结果表明,使用声音识别具有良好的实际效果,报警系统能够完成目标任务。  相似文献   

7.
本文介绍了声学基础和人耳听觉特性,详尽阐述了在电视节目录制中,声音在频率补偿和混响方面的艺术处理。结合在我台600m^2演播厅录音、扩音的经验,对声音拾取和录音技巧做了详细介绍。  相似文献   

8.
基本概念 人耳对声音强度反应的主观量称之为”响度“。响度是感觉判断声音的强弱,即声音响亮的程度。要明确这一概念.有必要先了解一下几个声音相关概念.以及传统的音频测量仪表.  相似文献   

9.
本文在分析目前声讯业务不足之处的基础上,提出了用于Audiotex业务的,基于赵文思想的声音数据库的组织与管理方法,以及分类导引用户界面技术,并介绍了系统模型,组成及其功能。  相似文献   

10.
声音编码与图像编码一样,采用数字压缩方法,降低声音信号中的冗余和丢掉声音信号中的不相关部分(凡不能被人耳感觉到的信号),使数字声音的信息量减少到最小程度,但同时又能精确地再现原始的声音信号。随着人们对声音特性和人耳特性的不断研究,声音编码技术得到很大的发展。下面先介绍人耳的听觉特性,接着介绍数字电视中的几种声音编码方法。1 人耳的听觉特性在人的听觉上,一个较强的声音的存在掩蔽了另一个较弱声音的存在,这就是人耳掩蔽效应。图1为掩蔽效应的原理图,a、b、c为同时存在的3个频率相近的声音,a声音最强,虚线以下表示是由…  相似文献   

11.
基于PCA与Fisherface互补双特征提取的人耳图像识别   总被引:1,自引:0,他引:1  
人耳识别目前是一种新的生物特征识别技术,特征提取是模式识别技术中的关键环节,决定着分类结果正确率的高低,单特征提取方法需要在一定的条件下才能取得较高的识别率,但是采用双特征提取却可以克服单特征提取的这一局限性.为了提高分类结果的正确率,提出了一个全新的方法,即基于主成分分析(PCA)与fisherface的互补双特征提取方法,并将其运用于人耳图像识别中,在北京科技大学提供的人耳图像库上的实验结果表明,该方法的人耳识别率明显高于PCA、fisherface、ICA单特征提取的人耳识别率.  相似文献   

12.
一种基于飞机目标CFD图的目标特征提取算法研究   总被引:1,自引:0,他引:1  
随着雷达目标微多普勒现象的发现,目标的微动特性在雷达自动目标识别中逐渐受到了广泛的关注。微动目标回波中包含了精细的目标微多普勒特征信息,因此,可以从其中推断出目标特有的独立特征。而基于目标微动回波时频图的特征更是因为其信息量充足的特点,成为了一种新兴有效的目标分类特征。文中主要研究了飞机目标的韵律频率图(Cadence Frequency Diagram,CFD)特征分类算法,详细叙述了算法的具体步骤。仿真分析了CFD特征在飞机目标分类中的特点和优势,并且研究了相关参数对CFD特征的影响。  相似文献   

13.
Border monitoring plays a key role in the national defense. In this study, we applied the sound identification technology on the border monitoring, and assumed an ideal border monitoring sound target recognition system. Feature extraction is a crucial step in this recognition system. As the border sounds are of non-stationary signals, the traditional methods failed to extract such kind of features. Fortunately, wavelet packet transform (WPT) can provide an arbitrary time-frequency decomposition for the signals. Based on WPT, a novel feature extraction method using optimum wavelet packet decomposition (OWPD) was proposed. According to the characteristics analysis of the border monitoring sounds using WPT, the signals were analyzed by selective multi-scale wavelet packet decomposition (i.e. OWPD), and then we built the meaningful and compact energy feature vectors as the input vectors of the BP neural network, in order to recognize the border monitoring sound. Extensive experimental results showed that this feature extraction method has convincing recognition efficiency.  相似文献   

14.
特征提取是合成孔径雷达目标识别关键技术与核心任务。为了更好地提取目标特征,稀疏约束将被添加在非负矩阵分解法中,并应用于图像目标特征提取,通过利用稀疏约束的非负矩阵分解方法对sAR目标图像进行分解,构建具有稀疏性的目标特征矢量,提高了特征矢量的类内相似性与类间差异性。利用基于支持向量机的分类方法对MSTAR数据进行目标识别试验,试验结果表明,添加稀疏约束的NMF方法与PCA、ICA以及一般NMF特征提取方法相比,能够显著提高目标识别的稳定性和准确率。  相似文献   

15.
汪少敏  杨迪  任华 《电信科学》2018,34(12):117-124
大数据时代,文本分类是文本数据挖掘和文本价值探索领域的重要工作。传统的文本分类系统存在特征提取能力弱、分类准确率不高的问题。相对于传统的文本分类技术,深度学习技术具有准确率高、特征提取有效等诸多优势,有必要将深度学习技术引入文本分类系统,以解决传统文本分类系统存在的问题。在分析传统文本分类系统的基础上,提出了基于深度学习的文本分类系统的体系架构和关键技术,同时对传统分类模型、TextCNN、CNN+LSTM多种分类模型进行了验证比对。  相似文献   

16.
介绍了图像目标识别技术中的图像分割,不变性参数提取和目标分类,利用图像目标的均匀性和相应知识自适应地分割和提取图像目标,被提取的每个图像目标的不变性参数由归一化过程和Zernike矩提取,并利用MPNN模型将图像目标分类,实验结果该识别系统能识别光照不均匀或复杂背景下的图像目标。  相似文献   

17.
一种基于卷积神经网络的雷达目标分类方法   总被引:1,自引:0,他引:1  
高淑雅  高跃清 《信息技术》2020,(1):91-94,100
雷达作为对低空和地面目标探测及监视预警的主要手段,在安全领域应用广泛。针对现阶段实际应用中雷达目标分类技术中过于依赖人工提取特征的问题,提出了一种基于卷积神经网络的分类方法,对雷达回波数据进行二维傅里叶变换得到距离-多普勒图像,再以距离-多普勒图集作为数据集,训练神经网络,得到能够完成雷达目标识别的网络模型。结果表明,相较于传统方法,基于卷积神经网络的目标识别模型在省去人工工作的同时提高了目标识别精度。  相似文献   

18.
We describe the first single microphone sound localization system and its inspiration from theories of human monaural sound localization. Reflections and diffractions caused by the external ear (pinna) allow humans to estimate sound source elevations using only one ear. Our single microphone localization model relies on a specially shaped reflecting structure that serves the role of the pinna. Specially designed analog VLSI circuitry uses echo-time processing to localize the sound. A CMOS integrated circuit has been designed, fabricated, and successfully demonstrated on actual sounds.  相似文献   

19.
文章介绍了船舶生活垃圾中不同材质的物体敲击声波的特征提取方法, 建立了基于倒谱与神经网络的物体材质的智能识别模型与算法, 并通过对玻璃、塑料、金属铝箔等常见物体材质进行分类测试, 证实了该分类方法的有效性, 为船舶生活垃圾的智能分类提供了新思路。  相似文献   

20.
Underwater mammal sound classification is demonstrated using a novel application of wavelet time-frequency decomposition and feature extraction using a Bienenstock, Cooper, and Munro (1982) (BCM) unsupervised network. Different feature extraction methods and different wavelet representations are studied. The system achieves outstanding classification performance even when tested with mammal sounds recorded at very different locations (from those used for training). The improved results suggest that nonlinear feature extraction from wavelet representations outperforms different linear choices of basis functions  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号