首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
目的 目前针对舌头的语音同步动画技术还未得到广泛的研究。在此背景下,提出了一种基于生理模型的舌头动画合成方法。方法 首先构建了一个精细的、能够在肌肉激励下产生逼真舌头变形的舌头生理模型;其次利用该舌头模型合成了大量的舌头运动样本,并据此通过学习得到一个从肌肉激励到舌头轮廓的转换模型;然后对采集的动态2维舌头轮廓数据进行运动参数估计以得到与音素对应的体素(肌肉激励序列和刚体位移序列);最后将体素按一定的排列方式输入到舌头生理模型进行仿真以生成相应的舌头动画。结果 该系统可以合成听觉效果逼真的语音和视觉效果逼真且与合成语音同步的舌头动画。结论 本文方法可以根据汉语普通话或其他语言的2维舌头轮廓数据构建音素—体素数据库,并据此合成该语言对应的高真实感的3维舌头动画。  相似文献   

2.
在基于音素识别的语种辨识系统中,特定的一段语音,音素识别的结果会受到说话人和信道等干扰因素的影响。对此,文中基于音素搭配关系对每段语音构建相应的特征向量表示。在向量空间中,利用因子分析建立噪声子空间的数学描述模型,并在语言模型的训练和识别过程加以消除。在NISTLRE2007的测试任务中,相对于基于音素识别的语种辨识基线系统,该方法可有效提高系统性能。在30s时长测试中,基于音素识别的语言模型和基于音素识别的支持向量机模型的等错误率分别相对降低14。4%和12。9%。  相似文献   

3.
功能简介 灵格斯是一款简明易用的翻译与词典软件,支持多语种屏幕取词、索引提示和语音朗读功能,是新一代的词典翻译专家。灵格斯是一个强大的词典查询和翻译工具。它能很好地在阅读和书写方面帮助用户,让对外语不熟练的您在阅读或书写英文文章时变得更简单更容易。使用灵格斯创新的屏幕取词功能,您只需将鼠标移动到屏幕中的任何有单词的位置,按下Ctrl键,灵格斯就能智能地识别出该单词的内容及其所属的语言,即时显示出相应的翻译结果。灵格斯拥有当前主流商业词典软件的全部功能,并创新地引入了跨语言内核设计及开放式的词典管理方案,同时还提供了大量语言词典和词汇表下载,是学习各国语言,了解世界的最佳工具。  相似文献   

4.
一种联合语种识别的新型大词汇量连续语音识别算法   总被引:1,自引:1,他引:0  
单煜翔  邓妍  刘加 《自动化学报》2012,38(3):366-374
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuous speech recognition, LVCSR)算法,并构建了实时处理系统. 该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明, 音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%.  相似文献   

5.
针对俄语语音合成和语音识别系统中发音词典规模有限的问题,提出一种基于长短时记忆(LSTM)序列到序列模型的俄语词汇标音算法,同时设计实现了标音原型系统。首先,对基于SAMPA的俄语音素集进行了改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象,并依据改进的新音素集构建了包含20 000词的俄语发音词典;然后利用TensorFlow框架实现了这一算法,该算法通过编码LSTM将俄语单词转换为固定维数的向量,再通过解码LSTM将向量转换为目标发音序列;最后,设计实现了具有交互式单词标音等功能的俄语词汇标音系统。实验结果表明,该算法在集外词测试集上的词形正确率达到了74.8%,音素正确率达到了94.5%,均高于Phonetisaurus方法。该系统能够有效为俄语发音词典的构建提供支持。  相似文献   

6.
以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。  相似文献   

7.
为实现中英文民航陆空通话语音识别,提出一种基于深度学习的跨语种民航陆空通话语音识别方法.基于共享隐层的卷积深度神经网络(CDNN)建立一个跨语种声学模型;将中文音素和英文音素(CMU)融合用于构建混合语言模型;在此基础上将CMU标准英文音素映射为TIMIT标准英文音素重构语言模型用于识别;为了缩短训练和解码的时间,在提取特征阶段加入低帧率.实验结果表明,卷积深度神经网络声学模型可较好地应用于民航陆空通话领域;音素映射方法能够进一步提高识别性能;加入低帧率后有效缩短了训练时间且使词错误率下降到4.28%.  相似文献   

8.
精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。  相似文献   

9.
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词.现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词.同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降.为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型.最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试.实验结果表明,基于分割识别的蒙古语LVCSR方法能解决大部分蒙古文单词的识别问题,并将蒙古语语音关键词检测系统的大量集外词转化成了集内词,大幅度提高了检测系统的查准率和召回率.  相似文献   

10.
东方网译     
早在七十年代,机器翻译即被列为人工智能的重要研究课题,但遗憾的是,到目前为止,这项课题也没有取得令人满意的结果,而且,从目前的技术水平来看,全文翻译类软件在今后数年内也不会有革命性的进展。但在另一方面。互联网的飞速发展使得信息的传递日益重要,人们迫切需要在不同的语言间进行沟通,过一矛盾促使了今天各种翻译工具的面市。在传统情况下,翻译软件所依赖的自动翻译技术包括语音翻译和文字翻译,主要的关键技术有四个方面:单词分析,语法分析,意义分析和文理分析。它的工作过程是,先把语句分成各个单词。通过存放于机器数据库内的电子字典查清词义,根据语法规则分析语句的意思,并把它变换成概念构造,然后借助语言模型生成目标语言。其中,语言模型即是原语言和目标语言间的中间语言,各种语言通过它可译成另一种所需语言。  相似文献   

11.
粤语和普通话之间的机器翻译研究应首先考虑由粤语到普通话的书面语翻译,并以单词为突破口。本文重点讨论粤-普书面语机器翻译中的词处理,尤其是方言词处理,包括方言词的识别和方言词的翻译两方面,同时介绍一个已经初步实现了的单词级粤-普机器翻译试验系统。文章最后将给出结论和讨论。  相似文献   

12.
为了改善语言模型提出了一种新型的语言模型修正方法,先利用音素段长的筛选性来获得部分音素的语言模型修正因子,再对修正因子加以权重用于纠正语言模型的偏差,从而能够有效提高系统识别性能。在CALLFRIEND Corpus上进行的测试中,系统单个前端的最好性能达到等错率下降1154%,整个系统等错率下降了693%,最后的等错率为950%。  相似文献   

13.
神经机器翻译由于无法完全学习源端单词语义信息,往往造成翻译结果中存在着大量的单词翻译错误。该文提出了一种融入单词翻译用以增强源端信息的神经机器翻译方法。首先使用字典方法找到每个源端单词对应的目标端翻译,然后提出并比较两种不同的方式,用以融合源端单词及其翻译信息: ①Factored 编码器: 单词及其翻译信息直接相加; ②Gated 编码器: 通过门机制控制单词翻译信息的输入。基于目前性能最优的基于自注意力机制的神经机器翻译框架Transformer,在中英翻译任务的实验结果表明,与基准系统相比,该文提出的两种融合源端单词译文的方式均能显著提高翻译性能,BLEU值获得了0.81个点的提升。  相似文献   

14.
日本政府和产业界共同承办的声音翻译通信研究所,最近宣布研制出能将普通人的话音自动转换成文字的声音文字自动转换系统。 该转换装置由声音识别系统工作站和集音麦克风等组成,集音麦克风收集到的声音能自动和事先输入在计算机中的声音辞典进行对照、分辨、识别其单词并将其显示出来。声音识别系统能瞬间捕捉到声音的变  相似文献   

15.
飞雪散花 《电脑迷》2009,(24):67-67
最近Google Translate增加了单词和整句朗读功能。此外,更在页面左侧增加了“经过翻译的搜索结果”和“工具和资源”功能,利用前者,我们能轻松地通过输入母语,搜索到指定语言网页中的内容,并将该网页语言自动翻译为我们的母语。  相似文献   

16.
特别推荐     
世界语言多媒体学习软件: 加拿大Amsdell电脑公司推出的此套语言学习软件以外星恐龙探测地球的动感画面,辅以多媒体背景音乐和磁性的真人配音,在不知不觉中你就将是个语言通了。此软件分为两个版本:“四种语言版”售价50元,可以学习英、日、法、西班牙语。您可以自由选择语言环境,通过10个Level水平,采取各种拼写方式,如看图选单词,填入空缺字母,抓取掉落字母组词等,同  相似文献   

17.
德语语音合成中的字音转换研究   总被引:1,自引:1,他引:0       下载免费PDF全文
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。  相似文献   

18.
现在不少浏览器都提供了即指即译功能,即在上网浏览网页时如果遇到不认识的英文单词,鼠标指向该单词,即可轻松翻译。有朋友问,在阅读Word文档时,如果遇到不熟悉的单词,能实现即指即译吗?其实Word 2010也提供了这种功能,它不仅能够即指即译,而且还能将翻译结果粘贴到其他文档,甚至还能听到单词或短语的发音呢。  相似文献   

19.
现在不少浏览器都提供了即指译功能,即在上网浏览网页时如果遇到不认识的英文单词,鼠标指向该单词,即可轻松翻译。有朋友问,在阅读Word文档时,如果遇到不熟悉的单词,能实现即指即译吗?其实Word 2010也提供了这种功能,它不仅能够即指即译,而且还能将翻译结果粘贴到其他文档,甚至还能听到单词或短语的发音呢。  相似文献   

20.
综合了语音识别中常用的高斯混合模型和人工神经网络框架优点的Tandem特征提取方法应用于维吾尔语声学模型训练中,经过一系列后续处理,将原始的MFCC特征转化为Tandem特征,以此作为基于隐马尔可夫统计模型的语音识别系统的输入,并使用最小音素错误区分性训练准则训练声学模型,进而完成在测试集上的识别实验。实验结果显示,Tandem区分性训练方法使识别系统的单词错误率比原先的基于最大似然估计准则的系统相对减少13%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号