首页 | 本学科首页   官方微博 | 高级检索  
     

基于声学模型共享的零资源韩语语音识别
引用本文:王皓宇,JEON Eunah,张卫强,李科,黄宇凯.基于声学模型共享的零资源韩语语音识别[J].数据采集与处理,2023,38(1):93-100.
作者姓名:王皓宇  JEON Eunah  张卫强  李科  黄宇凯
作者单位:1.清华大学电子工程系,北京国家信息科学技术研究中心,北京 100084;2.北京海天瑞声科技股份有限公司,北京 100083
基金项目:NSFC-通用技术基础研究联合基金重点项目(U1836219)。
摘    要:精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。

关 键 词:语音识别  零资源语音识别  韩语语音识别
收稿时间:2021/10/19 0:00:00
修稿时间:2021/11/4 0:00:00

Zero Resource Korean ASR Based on Acoustic Model Sharing
Wang Haoyu,Jeon Eunah,Zhang Weiqiang,Li Ke,Huang Yukai.Zero Resource Korean ASR Based on Acoustic Model Sharing[J].Journal of Data Acquisition & Processing,2023,38(1):93-100.
Authors:Wang Haoyu  Jeon Eunah  Zhang Weiqiang  Li Ke  Huang Yukai
Affiliation:1.Beijing National Research Center for Information Science and Technology, Department of Electronic Engineering, Tsinghua University, Beijing 100084, China;2.Beijing Haitian Ruisheng Science Technology Ltd., Beijing 100083, China
Abstract:
Keywords:speech recognition  zero resource speech recognition  Korean speech recognition
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号