首页 | 本学科首页   官方微博 | 高级检索  
     

电视剧语音识别中的半监督自动语音分割算法
引用本文:龙艳花,茅红伟,叶宏. 电视剧语音识别中的半监督自动语音分割算法[J]. 数据采集与处理, 2019, 34(2): 281-287
作者姓名:龙艳花  茅红伟  叶宏
作者单位:上海师范大学信息与机电工程学院, 上海, 200234
基金项目:上海市青年科技英才扬帆计划14YF1409300;国家自然科学基金61701306上海市青年科技英才扬帆计划(14YF1409300)资助项目;国家自然科学基金(61701306)资助项目。
摘    要:针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进。在英国科幻电视剧“神秘博士”数据集合上的实验结果表明,提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能,不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题,还能对相应的大段连续文本标注进行分段,保证分割后各语音段时间标签及其对应文本的准确性。

关 键 词:语音识别  半监督  语音标注
收稿时间:2017-06-25
修稿时间:2017-12-29

Semi-supervised Automatic Speech Segmentation for TV-drama Speech Recognition
Long Yanhu,Mao Hongwei,Ye Hong. Semi-supervised Automatic Speech Segmentation for TV-drama Speech Recognition[J]. Journal of Data Acquisition & Processing, 2019, 34(2): 281-287
Authors:Long Yanhu  Mao Hongwei  Ye Hong
Affiliation:The College of Information, Mechanical and Electrical Engineering, Shanghai Normal University, Shanghai, 200234,China
Abstract:
Keywords:
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号