期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

贾林李心科《数字社区&智能家居》2009,5(12):9779-9781

语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术：VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法．可以提高噪音影响下的语音识别率。相似文献

2.

基于VXML技术的语音门户研究

贾林李心科《数字社区&智能家居》2009,(34)

语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法,可以提高噪音影响下的语音识别率。相似文献

3.

浅谈对英语语音语调教学及研究的理解

范艳霞《网友世界》2013,(22):127-127

我们为什么需要进行英语语音教学及研究？语音教学中,我们该教什么和研究什么？该怎样教英语语言？作者根据她对英语语音教学、学习的经验及从王桂珍教授的语音教学培训中习得的如何在中国语言环境中教语音知识,回答了提出的问题。相似文献

4.

基于中文语音识别技术的舰艇指挥训练系统的研究

下载免费PDF全文

景春进陈东东周琳琦《计算机测量与控制》2014,22(8):2571-2573

针对舰艇指挥训练系统的特点,提出了一种利用语音识别技术提高其训练效率的方法;首先分析了舰艇指挥指令的语言特点,然后研究了基于Sphinx平台的汉语连续语音识别的相关问题,包括声学模型的训练、语言模型的训练及语音识别引擎等;最后设计并实现了一个非特定人,中等专用词汇量的连续汉语语音识别系统;实验采用了一定数量的数字和专用词汇进行验证,结果表明,经过声学模型训练后,该系统的识别率有较大提高;该方法对提高舰艇指挥训练系统的自动化水平具有一定的指导意义。相似文献

5.

基于汉语语音特点的大词表语音识别系统的研究 总被引：2，自引：0，他引：2

李建民赵彤青《计算机学报》1992,15(5):364-370

本文探讨了汉语语音识别的若干问题,并简单介绍了一个大词表汉语语音识别系统,该系统充分考虑了汉语语音的特点,其中主要是汉语语音具有音节性比较强的特点、音节的简单声韵母结构以及汉语以词/词组为语音交流基础的特点.该系统一个显著的特点是系统可以不进行任何训练地添加新词汇,从而使得系统具有比较好的用户接口. 现在系统具有10,000多个词汇,实时测试的平均识别结果是93.1％. 相似文献

6.

基于Adaboost算法的汉语儿向语音检测

《计算机工程》2017,(5)

儿向语音对早期儿童成长有较大影响,正确检测并充分利用儿向语音具有现实意义。为此,构建一种基于Adaboost算法的汉语儿向语音检测模型,以提高检测准确率。使用决策树作为弱分类器对提取的汉语儿向语音特征进行学习,并组成弱分类器元组,同时对该弱分类器组的分类结果进行加权,区分待测语音的类别。实验结果表明,汉语儿向语音的元音持续时长超过非儿向语音的元音持续时长;提升弱分类器的数量可提高汉语儿向语音检测正确率;分段语音时间越长,汉语儿向语音检测正确率越高;采用改进的Adaboost算法比采用v-SVM算法具有更高的准确率和精度,同时可增强系统的鲁棒性。相似文献

7.

语音处理技术在语言学习中的应用 总被引：5，自引：0，他引：5

岳东剑季洪飞《计算机工程与应用》2001,37(4):112-114

语音处理技术应用于语言的学习,可以改进、加强和丰富传统的语言学习方法,有利于提高学习效率;然而,如何有效地利用这些技术,建立各种计算机辅助语言学习ＣＡＬＬ（Ｃｏｍｐｕｔｅｒ－ＡｉｄｅｄＬａｎｇｕａｇｅ　Ｌｅａｒｎｉｎｇ）系统,是当前语音处理技术研究发展的一个重要方向。该文通过对传统的语言教学方法中所涉及到的主要因素的分析,研究了语音处理技术在语言学习系统中应用的主要层次和方法,以及使其更有效等方面的问题。相似文献

8.

中国英语语音教学中不容忽视的问题

杨晶彬《网友世界》2014,(8):144-144

正英语语音教学往往是整个英语教学的起点,语音关是教学的第一关。对于英语学习者来说,学习英语语音往往也是学习英语的开始。在中国,英语教学是外语教学,英语学习者基本上是在人造环境下依靠人为努力才能学会英语语音。在这一基础上,我们提出以下有关英语语音教学不容忽视的几个问题,与学界共同讨论。第一,应该充分认识到英语语音学习的僵化易、纠正难的特点。语言的基本功能之一是交际,而交际的决定因素是语义, 相似文献

9.

基于深度学习的合成语音转换问题研究

王翠英《自动化与仪器仪表》2023,(7):196-200

为提高合成语音转换效果,提出一种基于深度学习的合成语音转换方法。方法以StarGAN-VC2模型为语音转换模型,通过采用DFCNN模型对语音进行识别获取文本,采用Seq2Seq模型对识别结果进行机器翻译,并分别基于Fastspeech模型、Tacotron模型对汉语语音和英语语音进行合成,最后利用StarGAN-VC2模型进行语音转换,实现了汉语英语双语合成语音的转换。仿真结果表明,所提方法对汉语英语双语合成语音具有良好的转换效果,MOS和DMOS主观评分较高,对汉语-英语和英语-汉语转换后的语音MOS评分平均值分别为3.46和3.58,对汉语-英语和英语-汉语转换后的语音DMOS评分平均值分别为3.64和3.72,且转换后的波形图噪声较少,频谱图幅度较亮,满足合成语音转换质量需求。相似文献

10.

基于声学模型共享的零资源韩语语音识别

王皓宇 JEON Eunah 张卫强李科黄宇凯《数据采集与处理》2023,38(1):93-100

精准的语音识别系统通常使用大量的有标注语音数据训练得到,但现有的开源大规模数据集只包含一些广泛使用的语言,诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法,它利用不同语种间的相似性,可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上,利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异,结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。相似文献

11.

基于强化学习的壮语词性标注

唐素勤孙亚茹李志欣张灿龙《计算机工程》2020,46(4):309-315

目前壮语智能信息处理研究处于起步阶段,缺乏自动词性标注方法.针对壮语标注语料匮乏、人工标注费时费力而机器标注性能较差的现状,提出一种基于强化学习的壮语词性标注方法.依据壮语的文法特点和中文宾州树库符号构建标注词典,通过依存句法分析融合语义特征,并以长短期记忆网络为策略网络,利用循环记忆完善部分观测信息.在此基础上,引入强化学习框架,将目标词性作为环境反馈,通过特征学习不断逼近目标真实值.实验结果表明,该方法可缓解词性标注模型对训练语料库的依赖,能够快速扩大壮语标注词典的规模,实现壮语词性的自动标注. 相似文献

12.

言语信息处理的进展 总被引：1，自引：0，他引：1

蔡莲红贾珈郑方《中文信息学报》2011,25(6):137-142

该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持了语言学习与口语水平测评等应用;跨信道、环境噪音、多说话人、短语音、时变语音等因素存在的情况下提高识别正确率,是说话人识别的研究热点;言语合成主要关注多语言合成、情感言语合成、可视言语合成等;言语知觉计算开展了言语测听、噪声抑制算法、助听器频响补偿方法、语音信号增强算法等研究。将言语处理技术与语言、网络有效结合,促进了更加和谐的人机言语交互。相似文献

13.

混合多尺度卷积结合双层LSTM语音情感识别

梁科晋张海军刘雅情张昱王月阳《计算机与现代化》2023,(1):63-68

针对深度学习算法在语音情感特征提取方面的不足以及识别准确率不高的问题,本文通过提取语音数据中有效的情感特征,并将特征进行多尺度拼接融合,构造语音情感特征,提高深度学习模型对特征的表现能力。传统递归神经网络无法解决语音情感识别长时依赖问题,本文采用双层LSTM模型来改进语音情感识别效果,提出一种混合多尺度卷积与双层LSTM模型相结合的模型。实验结果表明,在中科院自动化所汉语情感数据库（CASIA）和德国柏林情感公开数据集（Emo-DB）下,本文所提语音情感识别模型相较于其他情感识别模型在准确率方面有较大提高。相似文献

14.

汉语词性标注方法的研究 总被引：4，自引：0，他引：4

魏欧孙玉芳《计算机科学》2000,27(7):71-75

1 引言自然语言中,表达意义的符号(词)往往在各个层面上有歧义。在句法层面上,一个词可以兼好几种词性;在语义层面上,一个词可能有多个义项。词性歧义是由语言中的兼类词,即具有不止一个词性特征的词所引起的,只有在一定的上下文语境关系中,词所表现相似文献

15.

Language and Gender Classification of Speech Files Using Supervised Machine Learning Methods

Yaakov HaCohen-Kerner Ruben Hagege 《控制论与系统》2017,48(6-7):510-535

Many language identification (LID) systems are based on language models using techniques that consider the fluctuation of speech over time. Considering these fluctuations necessitates longer recording intervals to obtain reasonable accuracy. Our research extracts features from short recording intervals to enable successful classification of spoken language. The feature extraction process is based on frames of 20 ms, whereas most previous LIDs presented results based on much longer frames (3?s or longer). We defined and implemented 200 features divided into four feature sets: cepstrum features, RASTA features, spectrum features, and waveform features. We applied eight machine learning (ML) methods on the features that were extracted from a corpus containing speech files in 10 languages from the Oregon Graduate Institute (OGI) telephone speech database and compared their performances using extensive experimental evaluation. The best optimized classification results were achieved by random forest (RF): from 76.29% on 10 languages to 89.18% on 2 languages. These results are better or comparable to the state-of-the-art results for the OGI database. Another set of experiments that was performed was gender classification from 2 to 10 languages. The accuracy and the F measure values for the RF method for all the language experiments were greater than or equal to 90.05%. 相似文献

16.

手语合成中的多模式行为协同韵律模型 总被引：2，自引：0，他引：2

陈益强高文刘军发杨长水《计算机学报》2006,29(5):822-827

利用大量真实多模式行为数据进行学习训练、获取单模式行为的韵律模型以及多模式行为之间的协同关联模型的方法,来实现虚拟人多模式行为之间的协同.重点给出了多模式行为的韵律模型描述,同时给出基于手语韵律参数与语音韵律特征融合的协同控制韵律模型以及韵律参数获取方法,并运用于多模式行为协同控制中,取得了较好的实验结果.与传统的规则法相比,该学习方法更能刻画多模式之间协同关联的复杂性,更好地实现虚拟人多模式行为合成的逼真性. 相似文献

17.

多信息融合的汉语方言辨识

夏玉果戴红霞顾明亮徐敏《电脑与信息技术》2009,17(5):32-36

文章提出了一种融合声学、音素配位和韵律特征等多信息融合的汉语方言辨识系统,分析了将语言信息转化为这些特征的实验方法,在此基础上,根据汉语方言辨识的特点,提出了一种基于概率模型的多信息辨识机制,实验结果表明,韵律特征对于短时语音具有很好的辨识效果,而音位配列特征对于长时语音更加有效。对于汉语三种方言的辨识,融合这三种特征的辨识率达95％。相似文献

18.

基于语谱图的江西境内赣方言自动分区研究

颜为之王明文徐凡但扬杰罗健《中文信息学报》2021,35(4):1-7,15

汉语方言分区研究是语言学的重要组成部分.鉴于传统基于词汇和语法的人工方言分区方法具有一定的主观性,该文研究了如何有效利用语音本身特征进行方言的自动分区.论文首先构建了江西省11个省辖市、91个下辖县级行政区的时长约1500分钟的1223条语音语料库,然后在传统的MFCC语音特征提取基础上,提出了基于CNN的自编码降维语... 相似文献

19.

基于多特征的藏文微博情感倾向性分析

江涛袁斌于洪志加羊吉《中文信息学报》2017,31(3):163-169

中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性分析算法,算法使用情感词、词性序列、句式信息和表情符号作为特征,并针对藏文微博常出现中文表述的情况,将中文的情感信息也作为特征进行情感计算,利用双语情感特征有效提高了情感倾向性分析的效果。实验显示,该方法对纯藏文表述的微博情感倾向性分析正确率可达到79.8%,针对藏汉双语表述的微博在加入中文情感词、中文标点符号等特征后,正确率能够达到82.8%。相似文献