一种基于指纹因子的鲁棒音频检索方法 |
| |
引用本文: | 林静杨继臣张雪源 李新超. 一种基于指纹因子的鲁棒音频检索方法[J]. 数据采集与处理, 2016, 31(5): 1020-1027 |
| |
作者姓名: | 林静杨继臣张雪源 李新超 |
| |
作者单位: | 1.茂名职业技术学院机电信息系,茂名,525000; 2.华南理工大学电子与信息学院,广州,510641 |
| |
摘 要: | 针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。
|
关 键 词: | 音频检索 音频指纹 非负矩阵分解 音频字典 倒排索引 |
Robust Audio Retrieval Method Based on Fingerprint Factors |
| |
Affiliation: | 1.Department of Mechanical and Electrical Information, Maoming Vocational and Technical College, Maoming, 525000,China;2.School of Electronic and Information Engineering, South China University of Technology, Guangzhou, 510641, China |
| |
Abstract: | |
| |
Keywords: | audio retrieval audio fingerprint non-negative matrix factorization audio dictionary inverted index |
|
| 点击此处可从《数据采集与处理》浏览原始摘要信息 |
|
点击此处可从《数据采集与处理》下载全文 |
|