基于视觉画面的空间音频合成及电影行业应用研究 |
| |
引用本文: | 李思佳,刘世光.基于视觉画面的空间音频合成及电影行业应用研究[J].现代电影技术,2023(9). |
| |
作者姓名: | 李思佳 刘世光 |
| |
作者单位: | 天津大学智能与计算学部,天津大学智能与计算学部 |
| |
基金项目: | 国家自然科学基金项目《水下声音传播的真实感模拟关键技术研究》(62072328) |
| |
摘 要: | 新时代电影强国建设对电影技术的发展提出了新要求,创新视听算法和更优模型的自主研发成为人们关注的重点。部分早期影片存储时仅包含单声道音频,不能提供良好的听觉体验。为了解决这个问题,本文提出了一种利用视觉画面和已有单声道音频合成空间音频的方法,重构音频中的空间信息。该方法首先对单声道视频进行声源分离和定位,将其拆解成多个单声源及其位置信息。之后再对其进行空间音频重构,得到与视觉位置信息相一致的更加逼真的音频。实验结果表明,本文方法可以得到与视觉位置信息相一致的更加逼真的空间音频,给用户带来更好的沉浸体验。
|
关 键 词: | 视觉信息 空间音频 声源分离 深度学习 音频空间化 |
收稿时间: | 2023/10/16 0:00:00 |
修稿时间: | 2023/10/16 0:00:00 |
Research on spatial audio synthesis and its application on film industry based on visual contents |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《现代电影技术》浏览原始摘要信息 |
|
点击此处可从《现代电影技术》下载全文 |