共查询到19条相似文献,搜索用时 265 毫秒
1.
语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法.可以提高噪音影响下的语音识别率。 相似文献
2.
语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法,可以提高噪音影响下的语音识别率。 相似文献
3.
我们为什么需要进行英语语音教学及研究?语音教学中,我们该教什么和研究什么?该怎样教英语语言?作者根据她对英语语音教学、学习的经验及从王桂珍教授的语音教学培训中习得的如何在中国语言环境中教语音知识,回答了提出的问题。 相似文献
4.
针对舰艇指挥训练系统的特点,提出了一种利用语音识别技术提高其训练效率的方法;首先分析了舰艇指挥指令的语言特点,然后研究了基于Sphinx平台的汉语连续语音识别的相关问题,包括声学模型的训练、语言模型的训练及语音识别引擎等;最后设计并实现了一个非特定人,中等专用词汇量的连续汉语语音识别系统;实验采用了一定数量的数字和专用词汇进行验证,结果表明,经过声学模型训练后,该系统的识别率有较大提高;该方法对提高舰艇指挥训练系统的自动化水平具有一定的指导意义。 相似文献
5.
基于汉语语音特点的大词表语音识别系统的研究 总被引:2,自引:0,他引:2
本文探讨了汉语语音识别的若干问题,并简单介绍了一个大词表汉语语音识别系统,该系统充分考虑了汉语语音的特点,其中主要是汉语语音具有音节性比较强的特点、音节的简单声韵母结构以及汉语以词/词组为语音交流基础的特点.该系统一个显著的特点是系统可以不进行任何训练地添加新词汇,从而使得系统具有比较好的用户接口. 现在系统具有10,000多个词汇,实时测试的平均识别结果是93.1%. 相似文献
6.
7.
语音处理技术在语言学习中的应用 总被引:5,自引:0,他引:5
语音处理技术应用于语言的学习,可以改进、加强和丰富传统的语言学习方法,有利于提高学习效率;然而,如何有效地利用这些技术,建立各种计算机辅助语言学习 CALL(Computer-Aided Language Learning)系统,是当前语音处理技术研究发展的一个重要方向。该文通过对传统的语言教学方法中所涉及到的主要因素的分析,研究了语音处理技术在语言学习系统中应用的主要层次和方法,以及使其更有效等方面的问题。 相似文献
8.
正英语语音教学往往是整个英语教学的起点,语音关是教学的第一关。对于英语学习者来说,学习英语语音往往也是学习英语的开始。在中国,英语教学是外语教学,英语学习者基本上是在人造环境下依靠人为努力才能学会英语语音。在这一基础上,我们提出以下有关英语语音教学不容忽视的几个问题,与学界共同讨论。第一,应该充分认识到英语语音学习的僵化易、纠正难的特点。语言的基本功能之一是交际,而交际的决定因素是语义, 相似文献
9.
王翠英 《自动化与仪器仪表》2023,(7):196-200
为提高合成语音转换效果,提出一种基于深度学习的合成语音转换方法。方法以StarGAN-VC2模型为语音转换模型,通过采用DFCNN模型对语音进行识别获取文本,采用Seq2Seq模型对识别结果进行机器翻译,并分别基于Fastspeech模型、Tacotron模型对汉语语音和英语语音进行合成,最后利用StarGAN-VC2模型进行语音转换,实现了汉语英语双语合成语音的转换。仿真结果表明,所提方法对汉语英语双语合成语音具有良好的转换效果,MOS和DMOS主观评分较高,对汉语-英语和英语-汉语转换后的语音MOS评分平均值分别为3.46和3.58,对汉语-英语和英语-汉语转换后的语音DMOS评分平均值分别为3.64和3.72,且转换后的波形图噪声较少,频谱图幅度较亮,满足合成语音转换质量需求。 相似文献
10.
精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。 相似文献
11.
目前壮语智能信息处理研究处于起步阶段,缺乏自动词性标注方法.针对壮语标注语料匮乏、人工标注费时费力而机器标注性能较差的现状,提出一种基于强化学习的壮语词性标注方法.依据壮语的文法特点和中文宾州树库符号构建标注词典,通过依存句法分析融合语义特征,并以长短期记忆网络为策略网络,利用循环记忆完善部分观测信息.在此基础上,引入强化学习框架,将目标词性作为环境反馈,通过特征学习不断逼近目标真实值.实验结果表明,该方法可缓解词性标注模型对训练语料库的依赖,能够快速扩大壮语标注词典的规模,实现壮语词性的自动标注. 相似文献
12.
13.
针对深度学习算法在语音情感特征提取方面的不足以及识别准确率不高的问题,本文通过提取语音数据中有效的情感特征,并将特征进行多尺度拼接融合,构造语音情感特征,提高深度学习模型对特征的表现能力。传统递归神经网络无法解决语音情感识别长时依赖问题,本文采用双层LSTM模型来改进语音情感识别效果,提出一种混合多尺度卷积与双层LSTM模型相结合的模型。实验结果表明,在中科院自动化所汉语情感数据库(CASIA)和德国柏林情感公开数据集(Emo-DB)下,本文所提语音情感识别模型相较于其他情感识别模型在准确率方面有较大提高。 相似文献
14.
汉语词性标注方法的研究 总被引:4,自引:0,他引:4
1 引言自然语言中,表达意义的符号(词)往往在各个层面上有歧义。在句法层面上,一个词可以兼好几种词性;在语义层面上,一个词可能有多个义项。词性歧义是由语言中的兼类词,即具有不止一个词性特征的词所引起的,只有在一定的上下文语境关系中,词所表现 相似文献
15.
Many language identification (LID) systems are based on language models using techniques that consider the fluctuation of speech over time. Considering these fluctuations necessitates longer recording intervals to obtain reasonable accuracy. Our research extracts features from short recording intervals to enable successful classification of spoken language. The feature extraction process is based on frames of 20 ms, whereas most previous LIDs presented results based on much longer frames (3?s or longer). We defined and implemented 200 features divided into four feature sets: cepstrum features, RASTA features, spectrum features, and waveform features. We applied eight machine learning (ML) methods on the features that were extracted from a corpus containing speech files in 10 languages from the Oregon Graduate Institute (OGI) telephone speech database and compared their performances using extensive experimental evaluation. The best optimized classification results were achieved by random forest (RF): from 76.29% on 10 languages to 89.18% on 2 languages. These results are better or comparable to the state-of-the-art results for the OGI database. Another set of experiments that was performed was gender classification from 2 to 10 languages. The accuracy and the F measure values for the RF method for all the language experiments were greater than or equal to 90.05%. 相似文献
16.
17.
18.
19.
中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性分析算法,算法使用情感词、词性序列、句式信息和表情符号作为特征,并针对藏文微博常出现中文表述的情况,将中文的情感信息也作为特征进行情感计算,利用双语情感特征有效提高了情感倾向性分析的效果。实验显示,该方法对纯藏文表述的微博情感倾向性分析正确率可达到79.8%,针对藏汉双语表述的微博在加入中文情感词、中文标点符号等特征后,正确率能够达到82.8%。 相似文献