共查询到10条相似文献,搜索用时 31 毫秒
1.
一种有效的音频信息检索技术 总被引:2,自引:0,他引:2
音频数据检索是数字化信息检索的迫切需要,但国际上对音频检索技术的研究尚远未尽人意。提出了一种新的音频检索机制,利用小波变换来产生音频数据的特征向量,通过关联规则挖掘发现音频数据特征元素向量与音频数据所属类别之间的联系,从而进行音频的分类和检索。实验表明,这种方法具有较高的检索效率,能大大缩短计算时间,具有良好的检索性能。 相似文献
2.
3.
音频数据规模不足是语音识别过程中的一个常见问题,通过较少的训练数据训练得到的语音识别模型效果难以得到保证。因此,提出一种基于生成对抗网络与特征融合的多尺度音频序列生成方法(multi-scale audio sequence GAN,MAS-GAN),包含多尺度音频序列生成器和真伪—类别判别器。生成器通过3个上采样子网络学习音频序列不同时域和频域的特征,再将不同尺度的特征融合成伪音频序列;判别器通过辅助分类器将生成的伪数据和真实数据区分开,同时指导生成器生成各类别的数据。实验表明,与目前主流的音频序列生成方法相比,所提方法的IS和FID分数分别提高了6.78%和3.75%,可以生成更高质量的音频序列;同时通过在SC09数据集上进行分类实验来评估生成音频序列的质量,所提方法的分类准确率比其他方法高2.3%。 相似文献
4.
提出了一个基于MP3音频数据的强健数字水印的实现方法。针对音频的特性,利用其三个相邻Section间能量的变化关系,嵌入数字水印而不影响音频的品质,分别承受MP3压缩、低通滤波、标准化处理、D/A转换和信号裁剪的攻击,依然能够保持数字水印的完整性。在对音频数据认证时,该数字水印侦测及取回技术不需原始音频信号,就能将数字水印数据快速取出。同时在数字水印中应用错误更正码和同步码搜寻方法,使得当MP3音乐遭受攻击时,能大大提高水印数据的复原率。 相似文献
5.
基于WindoWs 98环境的多点双向数字语音通信 总被引:2,自引:1,他引:2
当前数字语音通信已在许多领域得到了广泛应用。文章阐述了应用音频处理API函数 ,采用Client/Server模式和双套接字机制,在基于Windows 98系统上完成多点双向语音通信的方法,并给出其实现过程。实现机制为发送端利用低层音频服务的回调机制对音频数据块进行动态循环处理,防止了由于系统在写满语音输入缓冲区后,新、旧缓冲区交换时有一定的间隙而产生的输入数据泄漏。接收端采用数据缓冲机制,避免了由于网络延时等待音频数据而产生的话音停顿。 相似文献
6.
基于PC平台的Unix系统大都不具备多媒体功能,其中包括声音功能。本文以音频数据的输入输出为例,讨论了基于PC平台的Unix系统的音频设备驱动程序的实现方法。本文还人出了音频数据I/O的处理过程,以及应用程序、驱动程序和音频硬件的关系。 相似文献
7.
8.
详细地介绍了在Microrsoft的Windows操作平台上,如何通过对底层API函数的调用来实现对音频信号的采集、压缩、传输和播放。给出了获取系统音频CODECs信息和音频数据压缩的具体程序,并且对TCP和UDP两种传输协议在应用于传输音频数据时的各自特点进行了分析。 相似文献
9.