首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
一种有效的音频信息检索技术   总被引:2,自引:0,他引:2  
音频数据检索是数字化信息检索的迫切需要,但国际上对音频检索技术的研究尚远未尽人意。提出了一种新的音频检索机制,利用小波变换来产生音频数据的特征向量,通过关联规则挖掘发现音频数据特征元素向量与音频数据所属类别之间的联系,从而进行音频的分类和检索。实验表明,这种方法具有较高的检索效率,能大大缩短计算时间,具有良好的检索性能。  相似文献   

2.
音频信息检索综述   总被引:2,自引:0,他引:2  
随着多媒体和Internet技术的广泛应用和深入普及,多媒体数据的数量正在飞速增长,音频数据作为多媒体数据的重要组成部分,其信息量也在不断膨胀。如何有效的对音频信息进行检索成为现代信息检索的一个重要的研究领域。然而,音频数据同传统的文本数据不同,文本检索中的相关技术不能简单地应用到音频信息检索中,因为后者往往是基于语义的,所以不可避免地要用到音频数据的特征提取和模式匹配等技术。本文将对音频数据检索相关技术和系统做一综述性的介绍。  相似文献   

3.
音频数据规模不足是语音识别过程中的一个常见问题,通过较少的训练数据训练得到的语音识别模型效果难以得到保证。因此,提出一种基于生成对抗网络与特征融合的多尺度音频序列生成方法(multi-scale audio sequence GAN,MAS-GAN),包含多尺度音频序列生成器和真伪—类别判别器。生成器通过3个上采样子网络学习音频序列不同时域和频域的特征,再将不同尺度的特征融合成伪音频序列;判别器通过辅助分类器将生成的伪数据和真实数据区分开,同时指导生成器生成各类别的数据。实验表明,与目前主流的音频序列生成方法相比,所提方法的IS和FID分数分别提高了6.78%和3.75%,可以生成更高质量的音频序列;同时通过在SC09数据集上进行分类实验来评估生成音频序列的质量,所提方法的分类准确率比其他方法高2.3%。  相似文献   

4.
谢完成 《计算机应用》2003,23(12):114-117
提出了一个基于MP3音频数据的强健数字水印的实现方法。针对音频的特性,利用其三个相邻Section间能量的变化关系,嵌入数字水印而不影响音频的品质,分别承受MP3压缩、低通滤波、标准化处理、D/A转换和信号裁剪的攻击,依然能够保持数字水印的完整性。在对音频数据认证时,该数字水印侦测及取回技术不需原始音频信号,就能将数字水印数据快速取出。同时在数字水印中应用错误更正码和同步码搜寻方法,使得当MP3音乐遭受攻击时,能大大提高水印数据的复原率。  相似文献   

5.
基于WindoWs 98环境的多点双向数字语音通信   总被引:2,自引:1,他引:2  
张静  许刚 《计算机工程》2003,29(6):123-125
当前数字语音通信已在许多领域得到了广泛应用。文章阐述了应用音频处理API函数 ,采用Client/Server模式和双套接字机制,在基于Windows 98系统上完成多点双向语音通信的方法,并给出其实现过程。实现机制为发送端利用低层音频服务的回调机制对音频数据块进行动态循环处理,防止了由于系统在写满语音输入缓冲区后,新、旧缓冲区交换时有一定的间隙而产生的输入数据泄漏。接收端采用数据缓冲机制,避免了由于网络延时等待音频数据而产生的话音停顿。  相似文献   

6.
基于PC平台的Unix系统大都不具备多媒体功能,其中包括声音功能。本文以音频数据的输入输出为例,讨论了基于PC平台的Unix系统的音频设备驱动程序的实现方法。本文还人出了音频数据I/O的处理过程,以及应用程序、驱动程序和音频硬件的关系。  相似文献   

7.
本文论述了实现网络语音电话各种技术,其中包括使用底层音频函数实现声音的录制与播放,使用音频压缩管理实现音频数据的压缩与解压以及使用Winsock实现网络通信等技术。  相似文献   

8.
详细地介绍了在Microrsoft的Windows操作平台上,如何通过对底层API函数的调用来实现对音频信号的采集、压缩、传输和播放。给出了获取系统音频CODECs信息和音频数据压缩的具体程序,并且对TCP和UDP两种传输协议在应用于传输音频数据时的各自特点进行了分析。  相似文献   

9.
在多媒体课件中,越来越多的视频和音频数据得到了应用,视频和音频数据都是对时态要求比较高的数据,DIPMCAI是一个集声音,图形,图像,文字于一体的数字图像处理多媒体辅助教学系统。文章结合实际课题详细阐述了同步问题在多媒体课件开发中的应用。  相似文献   

10.
胡永刚  吴翊  卜江 《计算机应用》2006,26(9):2250-2254
声音指纹技术现在已经广泛的应用到了歌曲搜索、乐曲识别、声音修复等各个领域,但其关键技术——音频降维技术仍存在分类效果不好、可靠性不高等问题。针对音频数据高维化存在较大随意性,提出了基于模式识别的音频数据高维化的最优方法。并在此基础上,提出了采用加权PCA方法作为声音指纹的降维技术,不仅分类效果大为明显,且由于方法还保持了线性方法的简单性,保证了大批量处理数据成为可能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号