首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
MPEG压缩音频内容分析的前端工具   总被引:1,自引:0,他引:1  
李超  熊璋  吴晶 《计算机工程》2005,31(15):19-21,32
分析了MPEG压缩音频分析的基本原理和方法,介绍了一个MPEG压缩音频前端分析工具的设计与实现,能够方便准确地对MP3格式的音频进行分割、特征提取和归类,可用于多媒体数据库、数字化图书馆以及多媒体编辑等领域。  相似文献   

2.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题, 本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法. 在音频检索的训练阶段, 首先, 对样本音频信号进行稀疏化处理, 并通过压缩感知算法对稀疏化后的音频数据进行压缩; 其次, 提取压缩信号的音频指纹; 再次, 引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维, 最终得到检索特征库. 在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论. 实验结果表明, 所提音频检索方法在确保较好的检索准确率的基础上, 大幅度减小了样本音频数据库的存储量, 提高了音频的检索速率.  相似文献   

3.
MPEG音频是高保真立体声音频压缩编、解码的国际标准,该标准采用与心理声学模型相结合的子带编码方案,算法计算量大,难以满足实时应用的场合。文章不仅从理论上分析了编、解码算法的基本原理,而且提出了快速算法,设计并实现了一个纯软件MPEG音频编、解码器。该软件可在不需任何附加硬件的Pentium166MHz计算机上对立体声音频信号进行实时编码和解码。  相似文献   

4.
编程实现对音频压缩管理器(ACM)的调用   总被引:1,自引:0,他引:1  
未经压缩的原始音频文件体积一般都非常的庞大,特别是在网络带宽的限制下,音频文件在进行传输之前都必须进行压缩。对音频的压缩有很多的方法,压缩比例和音质各不相同,算法也是千差万别。对于一般的程序来说,我们并不想亲自去写压缩和解压程序,这时Windows本身自带的音频压缩管理器(Audio Compression Manager)就成为了我们最好的选择。应用程序只需通过ACM提供的编程接口调用其编解码器(Coder-Decoder,CODEC)即可完成对音频的压缩和解压。 进行压缩之前,首先应当确定要采用什么样的压缩格式。函数acmFormatChoose将显示一个格式选择对话框以便让用户  相似文献   

5.
音频压缩历史检测是音频取证领域的重要部分,有助于检测音频是否经过篡改和伪造.文中提出基于相位谱差值统计特征的WAV音频压缩历史检测算法.利用相位谱差值的均值、方差及峰度作为检测特征,能较准确地判断待测WAV音频是否被常见的4种编码器中的任一种进行压缩解压处理,并能进一步估计该WAV音频被压缩时采用的比特率.实验表明文中算法能有效检测WAV音频的压缩历史,且性能优于现有算法.  相似文献   

6.
介绍了一种针对低采样率音频信号的压缩方案。该方案通过混合滤波器组分解音频信号,并根据心理声学原理给不同的子带分配不同的比特数和量化阶距,最后还利用了哈夫曼编码技术对量化后数据进行编码。实验证明,这种基于Mp3框架的低采样率音频压缩方案能够对低至8kHz采样率的音频信号达到20kbps的压缩效果。  相似文献   

7.
介绍了图像压缩格式、音频压缩格式、视频压缩格式相关的技术,并进行了相应的分析。  相似文献   

8.
文中提出了一种新的适用于实时多媒体应用领域的音频编码算法。该算法首先对音频信号进行小波包分解,然后在小波域中计算掩蔽阈值,最后根据从心理声学模型得到的信号-掩蔽比来对各子带小波系数进行动态比特分配、量化和编码。实验结果表明该算法将CD音频信号压缩到64Kbps时,恢复信号的分段信噪比为32.32dB,主观上感觉无失真,该算法计算简单,可在不需任何附加硬件的Pentium 133HMz个人计算机上实  相似文献   

9.
模拟音频信号经过数字化后,会产生很大的数据量,不适合存储和传输的需要。数字音频的压缩编码已经成为一门非常重要的技术。该文主要介绍数字音频信号的常用压缩编码方法,如MPEG-1、MPEG-2、AC-3数字音频压缩编码标准,并阐述了各自的性能特点及应用领域。然后结合应用软件——Delphi,介绍制作音频播放器的过程,并利用音频播放器实现mp3等格式音频文件的播放。  相似文献   

10.
针对1-bit压缩感知音频传输存在重构精度与音频质量较差的问题,提出稀疏音频信号特征信息辅助的1-bit重构的方法。发送端利用稀疏音频信号的部分支撑集构建特征信息,并将特征信息扩频后叠加到1-bit压缩的音频信号上传输;接收端恢复特征信息和1-bit压缩的音频信号,并构建特征辅助的重构算法以恢复音频信号。相较于经典的1-bit音频压缩重构方法,所提方法可在不增加频谱开销的情况下改善恢复音频的MSE(Mean Square Error)值和MOS(Mean Opinion Score)评分。  相似文献   

11.
结合MP3编码特性,提出一种用于MP3版权保护的音频数字水印算法。该算法直接在压缩域中进行水印信息嵌入与提取,通过修改MP3比特流中的比例因子嵌入水印信息,无需MP3编解码过程。实验结果表明,该算法嵌入水印时不改变音频文件大小,提取水印时无需原始音频文件,其能在保证较好感知透明性的同时,具有较低的计算复杂度和较好的实时性。  相似文献   

12.
提出了基于MPEG压缩域音频流的足球比赛精彩场景自动分析与提取算法.首先直接提取出压缩域音频特征;然后基于提取出来的压缩域特征实现解说音的检测和分割,并且分别识别足球比赛中解说员激动解说和观众激昂欢呼两种类型音频事件;最后通过概率融合生成最终结果,融合结果所对应的比赛片段就是提取出的足球比赛精彩场景.实验结果表明了该算法的可行性.  相似文献   

13.
Robust and efficient content-based digital audio watermarking   总被引:2,自引:0,他引:2  
This paper proposes a set of digital watermarking schemes for WAV audio, WAV-table synthesis audio and compressed audio. The watermark embedding scheme is closely related to audio content and based on the human auditory system. The experimental results in listening and robustness illustrate that the proposed watermarking schemes can achieve an optimal balance between audibility and robustness of the watermarked audio. The proposed methods are also very useful and effective for copyright protection, tracing illegal distribution and other applications.  相似文献   

14.
陈健  赵岩  陈贺新 《计算机工程》2009,35(3):240-241
音视频同步是数字电视广播和多媒体通信等应用的关键技术。该文提出一种基于AVS并结合嵌入技术的音视频同步方法。将压缩音频数据嵌入AVS视频编码系统,保证传输或存储、接收端解码与播放过程中的音视频始终同步。实验结果表明,该方法实现了音视频完全同步,能减小用于同步的开销。  相似文献   

15.
基于视听分层模型的实时爆炸场景识别   总被引:1,自引:0,他引:1  
提出在实时环境下使用基于听觉和视觉的分层模型对MPEG多媒体数据流中的“爆炸”场景在压缩域进行识别的算法.首先用一个粗分支持向量机把爆炸和类似爆炸的音频从别的音频中识别出来,然后再分别用几个精细支持向量机把爆炸和类似爆炸的音频区分开,由此得到音频爆炸备选场景.由于大多数爆炸场景均伴随剧烈的视觉突变,因此对得到的音频爆炸备选场景再判断其对应的视觉特征是否发生了变化,得到最后的识别结果。  相似文献   

16.
李晨  王可鑫  田丽华 《计算机应用》2018,38(8):2301-2305
为了解决目前大多音频水印算法在应用于MP3音频时存在的效率低下、鲁棒性与不可感知性较难平衡等问题,提出基于MP3帧声道间低频能量的压缩域音频水印算法。该算法的嵌入和提取过程可分别在MP3压缩和解压缩的过程中完成,能大大提高水印的嵌入提取效率。而且由于低频能量具有较好的稳定性,算法利用MP3编解码过程中生成的改进离散余弦变换(MDCT)系数计算得到声道内低频能量,将左右声道内低频能量之比以固定步长量化,最终根据量化结果调整相应的MDCT系数实现水印嵌入;同时,结合不同比例因子频带能量的占比在计算声道内低频能量前对水印嵌入频带进行了筛选,从而能保证水印鲁棒性与不可感知性的平衡。实验显示,该算法可以在维持原始音频可听性的基础上实现对各种类型攻击较好的鲁棒性,尤其是可以抵抗MP3重压缩的攻击。  相似文献   

17.
为了方便网络传输和本地存储需对大量音频文件进行压缩处理,但获取存储空间下降的同时会牺牲相应的音质。针对音频最常使用的MPEG-1Layer3有损压缩方法,即mp3文件,使用ASRGAN(Audio Super-Resolution Generative Adversarial Nets)对码率下降的音频进行音质还原,使用生成模型和判别模型相互促进学习,并进行交叠加权处理,同时使用空洞卷积和双向循环网络增强整体网络对超长序列处理的能力,最终选出最优的音频提升模型。该方法减小了音频传输和存储所使用的网络带宽和存储容量,同时还能够获得较好的音质。  相似文献   

18.
AVS是《信息技术先进音视频编码》系列标准的简称,是中国自主制定的音视频编码标准,主要面向高清晰度电视、高密度光存储和移动媒体等应用。它是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,其中视频标准包括两部分:面向数字电视应用领域的AVS-P2和面向移动应用领域的AVS-P7。针对AVS两种视频标准基于移动视频应用领域上的关键技术进行比较,通过实验数据进行分析;对两种视频标准在移动视频领域的应用前景进行探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号