期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈正宇张燕郑玮《电子设计工程》2009,17(12)

基于内容的音频检索具有较高的实用价值.将安静环境下训练的模型应用于实际有背景噪声的环境中.分析各种语音增强技术,并通过性能对比,选取谱减法作为系统前端抗噪技术,给出一个将音频增强和音频检索系统级联组成的抗噪声音频检索系统,并给出适合系统使用的谱减法的改进算法. 相似文献

2.

基于多频带谱减法的抗噪声语音识别研究 总被引：1，自引：0，他引：1

万义龙《电视技术》2013,37(23)

为了减少在噪声环境下测试条件与训练条件不匹配导致的语音识别性能下降,提出了一种结合多频带谱减法的抗噪声语音识别系统。首先提取带噪语音的前几帧作为估计的噪声信号,将带噪语音、估计的噪声信号按频率划分M个互不相交的频带,然后根据每个频带内带噪语音与估计的噪声信号的性噪比,来确定该频带噪声的谱减参数。语音增强作为前端处理,与语音识别器级连构成抗噪声语音识别系统。通过实验仿真表明,基于多频带谱减法的抗噪声语音识别系统在不同信噪比不同类型的噪声下,识别性能明显优于基本谱减法。相似文献

3.

基于频谱减法的语音去噪算法研究 总被引：1，自引：1，他引：0

邓利娜黄晓革《电子设计工程》2011,19(8):113-115

语音增强技术是音频信号处理中的重要部分,频谱减法是目前在语音增强技术中最常用的方法之一。针对传统频谱减法会产生音乐噪声并无法消除音乐噪声的不足之处及高频噪声干扰比较严重的情况下频谱减法效果差的情况,采用了在频谱减法之后进行LMS滤波以降低音乐噪声对语音质量的影响和低通滤波以滤除脉冲干扰。根据仿真结果表明,改进扩展频谱减法能够有效降低音乐噪声和尖锐的高频兹兹声,从而提高信噪比,达到语音增强的目的。相似文献

4.

基于动态谱估计的改进谱减语音增强算法

陈武朱忠陈琳李强《国外电子元器件》2014,(1):35-37

语音增强是语音信号处理的重要课题。根据基于最小值追踪的谱估计方法,提出了一种非平稳噪声环境下快速追踪噪声变化的方法,将其应用到改进后的谱减法中,以提升语音增强的效果。仿真结果表明,改进后的谱减法能有效降低背景噪声,提高输出语音信号的信噪比。相似文献

5.

一种双微阵列语音增强方法

曾庆宁肖强王瑶谢先明龙超《电子与信息学报》2018,40(5):1187-1194

为提高语音通信系统在噪声环境下的使用性能,该文提出一种基于子带谱减与广义旁瓣抵消的双微阵列语音增强方法。基于双微阵列及子带结构分析,首先分别在低频带采用可变过减因子谱减法抑制噪声,在高频带采用修改互功率谱谱减法抑制非相干性噪声部分,再结合广义旁瓣抵消与端点检测进一步抑制强相关性噪声的影响。实验结果表明,该方法能够更加有效地抑制噪声的影响并提高语音的可懂度。相似文献

6.

基于最大后验相位估计的多带谱减语音增强算法

李真吴文锦张勤任慧《电子与信息学报》2017,39(9):2282-2286

传统语音增强算法中因为谱减法算法简单易于实现而得到广泛研究,谱减法的原理是将带噪语音幅度与估计的噪声幅度进行相减,并叠加带噪语音相位,进而重构增强语音谱。该方法在低信噪比下因为没有进行相位估计,会存在较大的估计误差,并且因为对噪声估计的不准确,会产生音乐噪声。基于谱减法的缺点该文提出一种基于最大后验相位估计的多带谱减法,其中多带谱减法可减少音乐噪声的影响,最大后验方法估计纯净语音相位,可以减少在低信噪比时的估计误差。实验结果表明该方法在低信噪比时取得了较好的增强效果。相似文献

7.

基于TMS320VC33的语音增强系统的实现

王瑜贾爱军孟涛《电声技术》2004,(3):24-26

环境中的加性噪声会降低话音通信的质量是话音通信系统中普遍存在的问题。采用TMS320VC33实现了基于改进型谱减法的实时语音增强系统。相似文献

8.

一种改进的基于几何谱减法的语音增强算法

《信息通信》2016,(7)

谱减法是语音增强处理中常用的方法。针对应用于单通道语音增强的谱减技术中存在的"音乐噪声"问题,引入了一种改进的基于几何谱减法的语音增强算法。大大消除了背景噪声,改善了"音乐噪声"现象,保持了较好的语音可懂度和自然度。相似文献

9.

一种基于小波变换和谱减法的改进的语音增强算法

卢景赵风海《电声技术》2018,(12):8-12

谱减法是目前受到广泛研究的语音增强算法之一,但谱减法分辨率固定及存在音乐噪声残留的问题,限制了谱减法的应用推广。本文针对以上问题,利用小波变换的多分辨率特性及谱减法运算量小、处理速度快的特点,提出了一种基于小波变换和改进的Berouti谱减法的改进语音增强算法。实验结果表明,该算法在抑制噪声,增强语音信号的可懂度及鲁棒性方面优于传统的谱减法。相似文献

10.

基于高速DSP的实时语音增强系统设计

唐建云《电子测试》2011,(10):46-50

随着移动通信技术的快速发展,语音增强的研究及其实际应用成为数字化通信的一个重要的研究方向。在数字信号处理技术的支撑下,许多优秀的语音增强算法的实时实现成为了可能。谱减法是一种运算量相对较小,增强效果明显,并且容易实时实现的语音增强算法,但是其缺点就是残留有音乐噪声。针对传统谱减法,本语音增强系统采用了一种改进算法,就是... 相似文献

11.

基于响度主分量模糊直方图的音频检索方法 总被引：1，自引：0，他引：1

郑贵滨韩纪庆李海峰《信号处理》2006,22(4):471-475

根据人耳听觉模型以归一化响度主分量为特征,采用模糊直方图检索音频信息,并根据响度数据的统计分布对直方图编码进行优化。实验结果表明,该方法在低信噪比下具有较好的性能,对噪音具有良好的顽健性(Robustness)。为噪音下的固定音频检索问题提供了有效的解决办法。相似文献

12.

电声技术新进展(待续)

杨军《电声技术》2014,(1):17-22

介绍了电声技术的最新进展,主要从新型扬声器、音频信号处理和声聚焦与声重现三个方面进行阐述,新型扬声器包括高指向性参量阵扬声器和全数字式扬声器系统,音频信号处理技术包括扬声器系统均衡、虚拟低音增强、立体声增强与人工混响等技术,声聚焦与声重放重点介绍了基于扬声器阵列信号处理的定向声辐射与空间声场重现技术。相似文献

13.

压缩域鲁棒音乐指纹算法研究 总被引：2，自引：0，他引：2

下载免费PDF全文

刘亚多李伟李晓强汪竹蓉冯瑞《电子学报》2010,38(5):1172-1176

对互联网海量MP3格式音乐数据进行基于内容的有效检索是当前一个重要而又很少涉及的研究方向.本文提出一种基于MDCT频谱熵的压缩域音频指纹算法,对各种常规频域和时间域的音频信号处理失真具有较强的鲁棒性.模拟实验在包含100首不同中文流行歌曲的音乐数据库上进行.对经受各种严重信号处理失真的粒度为5s左右的查询片段,能够取得超过90%的首位正确识别率. 相似文献

14.

车载式无线双模音视频传输监控系统设计与实现

胡宏《电视技术》2013,37(8)

基于CDMA2000和WCDMA的无线网络,设计并实现了车载式音视频监控系统,包括运行于后台的监控中心子系统和运行于终端的调用子系统.重点阐述了该监控系统中监控终端以及监控中心的软件设计和关键技术.系统在工程环境下进行了调用测试,测试结果表明,基于该设计的车载终端充分利用了CDMA2000和WCDMA网络的传输带宽,相对于单模的音视频传输,在传输效果上有较大的提高. 相似文献

15.

采用IP技术的新一代广播视音频采录快编系统建设

吴宇超仇玉萍单雪松《广播与电视技术》2020,(1):30-35

基于IP技术的广播采录快编系统以浙江广播电视集团的广播"快编"业务需求为导向进行设计,实现多套音视频节目的统一录制、存储、检索、回放、下载,为采编人员提供重要新闻的直播浏览、快速回退播放和音频实时剪辑下载等功能,并能将成品素材安全发送到制播网进行编辑或播出使用。相似文献

16.

低信噪比条件下的语音端点检测与增强

章勇勤《电声技术》2008,32(1):63-66,69

针对在低信噪比条件下难以实现语音端点检测,提出了基于混沌理论的解决方法,采用Duffing方程的间歇混沌特性对语音信号进行检测,同时对谱减法作了改进,根据入耳听觉掩蔽效应的语音增强算法,动态修正谱减系数,有针对性地进行谱减,有效克服了音乐噪声.在信噪比较低的情况下,按照该方案处理后的语音不仅信噪比显著提高,主观听觉失真有效减小,且语音清晰度、可懂度和舒适度极大改善. 相似文献

17.

一种基于倒排索引的音频检索方法

张雪源* 贺前华李艳雄叶婉玲《电子与信息学报》2012,34(11):2561-2567

传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4个方面作为评价指标,实验结果显示,该算法能够在平均1.101 s时间内实现92.58%的检索准确率。相似文献

18.

Generic content-based audio indexing and retrieval framework

Kiranyaz S. Gabbouj M. 《Vision, Image and Signal Processing, IEE Proceedings -》2006,153(3):285-297

Rapid increase in the amount of the digital audio collections presenting various formats, types, durations and other parameters that the digital multimedia world refers demands a generic framework for robust and efficient indexing and retrieval based on the aural content. Moreover, from the content-based multimedia retrieval point of view, the audio information can be even more important than the visual part as it is mostly unique and significantly stable within the entire duration of the content. A generic and robust audio-based multimedia indexing and retrieval framework, which has been developed and tested under the MUVIS system, is presented. This framework supports the dynamic integration of the audio feature extraction modules during the indexing and retrieval phases and therefore provides a test-bed platform for developing robust and efficient aural feature extraction techniques. Furthermore, the proposed framework is designed based on the high-level content classification and segmentation in order to improve the speed and accuracy of the aural retrievals. Both theoretical and experimental results are finally presented, including the comparative measures of retrieval performance with respect to the visual counterpart. 相似文献

19.

Modeling and control of expressiveness in music performance 总被引：1，自引：0，他引：1

Canazza S. De Poli G. Drioli C. Roda A. Vidolin A. 《Proceedings of the IEEE. Institute of Electrical and Electronics Engineers》2004,92(4):686-701

Expression is an important aspect of music performance. It is the added value of a performance and is part of the reason that music is interesting to listen to and sounds alive. Understanding and modeling expressive content communication is important for many engineering applications in information technology. For example, in multimedia products, textual information is enriched by means of graphical and audio objects. In this paper, we present an original approach to modify the expressive content of a performance in a gradual way, both at the symbolic and signal levels. To this purpose, we discuss a model that applies a smooth morphing among performances with different expressive content, adapting the audio expressive character to the user's desires. Morphing can be realized with a wide range of graduality (from abrupt to very smooth), allowing adaptation of the system to different situations. The sound rendering is obtained by interfacing the expressiveness model with a dedicated postprocessing environment, which allows for the transformation of the event cues. The processing is based on the organized control of basic audio effects. Among the basic effects used, an original method for the spectral processing of audio is introduced. 相似文献

20.

The HDTV Grand Alliance System

Petajan E. 《Communications Magazine, IEEE》1996,34(6):126-132

Broadcast television in the United States has remained essentially unchanged in the last 50 years except for the addition of color and stereo sound. Today, personal computers are meeting the need for random access of high-resolution images and CD-quality audio. Furthermore, advances in digital video compression and digital communication technology have cleared the way toward offering high-resolution video and audio services to consumers using traditional analog communications channels. In 1987, the US Federal Communications Commission (FCC) chartered an advisory committee to recommend an advanced television system for the United States. From 1990 to 1992, the Advanced Television Test Center (ATTC) tested four all-digital systems, one analog high-definition television (HDTV) system, and one enhancement NTSC system using broadcast and cable television environment simulators. The formation of the HDTV Grand Alliance in May 1993 resulted from the withdrawal of the only analog HDN system from the competition and a stalemate between the other four all-digital systems. The HDTV Grand Alliance system is composed of the best components from previously competing digital systems demonstrated to the FCC. The Moving Pictures Experts Group (MPEG-2) syntax is used with novel encoding techniques to deliver a set of video scanning formats for a variety of applications. This article describes the important features and concepts embodied in the HDTV Grand Alliance system 相似文献