首页 | 本学科首页   官方微博 | 高级检索  
     

基于i-vector的电子伪装语音鲁棒还原方法研究
引用本文:郑琳琳,张雄伟,孙蒙,李嘉康,张星昱. 基于i-vector的电子伪装语音鲁棒还原方法研究[J]. 数据采集与处理, 2020, 35(5): 880-891
作者姓名:郑琳琳  张雄伟  孙蒙  李嘉康  张星昱
作者单位:陆军工程大学指挥控制工程学院,南京,210007;陆军工程大学指挥控制工程学院,南京,210007;陆军工程大学指挥控制工程学院,南京,210007;陆军工程大学指挥控制工程学院,南京,210007;陆军工程大学指挥控制工程学院,南京,210007
基金项目:国家自然科学基金(61471394,62071484)资助项目;江苏省优秀青年基金(BK20180080)资助项目。
摘    要:语音的电子伪装是指采用变声设备或语音处理软件改变说话人的个性特征,以达到故意隐藏该说话人身份的目的。电子伪装语音还原是指通过技术手段将伪装语音变回原声,这对基于语音的身份鉴别有重要意义。本文将频域和时域伪装语音的还原问题抽象为伪装因子的估计问题,通过基于i-vector的自动说话人确认方法估计伪装因子,并引入对称变换进一步提高估计效果。该方法借助于i-vector的噪声鲁棒性,提高了真实含噪场景下伪装因子的估计精度,从而改进了噪声条件下电子伪装语音的还原效果。在干净语音库TIMIT上训练i-vector并在含噪语音库VoxCeleb1上对本文方法进行测试,结果表明,伪装因子估计的错误率从基线系统的9.19%降低为4.49%,还原语音在自动说话人确认等错误率和听觉感知方面也取得了提升。

关 键 词:电子伪装语音  伪装因子估计  自动说话人确认  噪声鲁棒性
收稿时间:2020-01-09
修稿时间:2020-05-16

Noise Robust Restoration of Electronic Disguised Voices Based on i-vector
ZHENG Linlin,ZHANG Xiongwei,SUN Meng,LI Jiakang,ZHANG Xingyu. Noise Robust Restoration of Electronic Disguised Voices Based on i-vector[J]. Journal of Data Acquisition & Processing, 2020, 35(5): 880-891
Authors:ZHENG Linlin  ZHANG Xiongwei  SUN Meng  LI Jiakang  ZHANG Xingyu
Affiliation:College of Command and Control Engineering, Army Engineering University, Nanjing, 210007, China
Abstract:
Keywords:electronic voice disguise  disguising factor  automatic speaker verification  noise robustness
本文献已被 万方数据 等数据库收录!
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号