期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于Dialogic语音卡实时数据采集的电话语音识别系统 总被引：2，自引：0，他引：2

肖熙王侠王作英《计算机工程与应用》2003,39(17):110-114

语音识别技术在新一代呼叫中心的IVR系统中得到了广泛的应用。为了使用Dialogic电话语音卡进行语音识别,文章解决了用Dialogic语音卡进行语音数据实时采集的问题,并给出了一种用动态背景噪声电平检测语音的算法,建立起了基于DialogicD/120JCT-LS电话语音卡的自动电话交换转接系统。相似文献

2.

基于数据模拟和HMM自适应的电话语音识别研究

左国玉刘文举阮晓钢《计算机工程与应用》2003,39(27):29-31,129

该文研究了基于数据模拟方法和HMM(隐马尔科夫模型)自适应的电话信道条件下语音识别问题。模拟数据模仿了纯净语音在不同电话信道条件下的语音行为。各基线系统的HMM模型分别由纯净语音和模拟语音训练而成。语音识别实验评估了各基线系统HMM模型在采用MLLR算法(最大似然线性回归)做无监督式自适应前后的识别性能。实验证明,由纯净语音转换生成的模拟语音有效地减小了训练语音和测试语音声学性质的不匹配,很大程度上提高了电话语音识别率。基线模型的自适应结果显示模拟数据的自适应性能比纯净语音自适应的性能最大提高达到9.8%,表明了电话语音识别性能的进一步改善和系统稳健性的提高。相似文献

3.

自适应帧长特征提取对语音识别系统性能的影响

贺前华陆以勤韦岗《计算机工程》2000,26(1):82-83,F003

提出一种自适应帧长语音特征分析方法,使语音编码更准确,达到提高语音识别性能无愧迁滤帧检测和过渡语音特征表示两方面。采用了两种特征表示方法。基于ＴＩＭＴＴ语音数据包和自定义的汉语语音数据的单词识别实验表明,这两种表示方面有相同的效果,都能在一定程度上提高知识系统的性能,但计算量稍有区别。基于ＴＩＭＩＴ数据的ＤＨＭＭ系统和ＣＨＭＭ系统的错误率分别下降了１１．２１％和９．５８％,基于自定义数据的ＤＨＭＭ相似文献

4.

基于字统计语言模型的汉语语音识别研究 总被引：1，自引：0，他引：1

吴应良韦岗李海洲《计算机应用研究》2000,17(5):6-8

隐马尔可夫模型（ＨＭＭ）由于较好地描述了语音的特性,在语音识别的研究中占主导地位,基于ＨＭＭ的识别算法也因取得了较好的识别效果而得到广泛应用．但其仅仅依靠语音信号的声学模型来进行识别处理,因此存在着不能利用语言的非声学知识进行识别的固有缺陷．该文提出的新方法将基于Ｎ元文法（Ｎ－ｇｒａｍ）的统计语言模型应用于汉语语音识别,推导了模型多数的估值公式,并给出了模型的训练和识别算法．初步实验表明：引入统计语言模型有利于降低识别难度和改善语音识别性能．相似文献

5.

电话语音监控系统的设计与实现

何成林杜利民《微计算机应用》2006,27(2):174-176

本文介绍了一种新的电话语音监控系统，该系统利用电话语音卡将通话双方的通话信号采集进计算机，再利用自动语音识别技术对双方的通话内容进行识别，以实现对通话的监控。本文首先分析了该系统的工作流程，并介绍了各主要功能模块的工作原理及其具体实现，最后对系统中各个工作线程之间同步的实现进行了分析。相似文献

6.

改进的MFCCs电话语音识别方法

刘洋贺前华黄海《计算机工程》2002,28(10):67-68

为了提高电话语音识别系统在环境和信道等噪声下的鲁棒性，文章针对电话语音MFCC特征的低阶系数最易受到污染的特点，通过舍充最易受污染的低阶MFCC系数，并结合RASTA滤波来去除卷积信道噪声，使系统的识别性能和抗噪性能有了明显的改善。相似文献

7.

基于VXML技术的语音门户研究

贾林李心科《数字社区&智能家居》2009,5(12):9779-9781

语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术：VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法．可以提高噪音影响下的语音识别率。相似文献

8.

基于VXML技术的语音门户研究

贾林李心科《数字社区&智能家居》2009,(34)

语音门户可以通过电话来浏览网络信息,而VXML是XML语言在语音门户方面的应用。介绍了语音门户系统的结构模型及主要关键技术:VXML技术、自动语音识别技术和语音合成技术,并结合汉语特点研究了单边自相关线性预测法,可以提高噪音影响下的语音识别率。相似文献

9.

基于HMM与RBF的混合语音识别新方法 总被引：5，自引：0，他引：5

何振亚顾明亮王太君史笑兴《数据采集与处理》1999,14(2):153-156

提出了一种隐马尔可夫模型（ＨＭＭ）和径向基函数神经网络（ＲＢＦ）相结合的语音识别新方法。该方法首先利用ＨＭＭ生成最佳语音状态序列,然后用函数逼近技术产生对最佳状态序列进行时间规正,最后通过ＲＢＦ神经网络进行分类识别。理论和实验结果表明,该系统比ＨＭＭ具有更好的识别效果,特别对提高易混淆词的识别性能尤为显著。相似文献

10.

基于MFCCs滤波的电话语音识别的通道补偿方法 总被引：4，自引：0，他引：4

韩纪庆高文《计算机学报》1998,21(12):1125-1130

本文提出一种基于ＭＦＣＣｓ滤波的通道补偿方法ＲＭＦＣＣ。它具有性能良好和运算简单的优点，在不失精度的前题下减少了计算代价。ＲＭＦＣＣ的性能也优于ＣＭＳ和二级ＣＭＳ。通过讨论发现许多抑制通道噪声的方法从本质上说都是采用滤波的方法，我们也证实了抑制非常低的调制频率是进行顽健的电话语音识别的有效途径。相似文献

11.

基于HTK的连续汉语数码语音输入系统研究

杨嵩《计算机与数字工程》2012,40(4):35-38

HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成以及字符识别等领域。文章在详细介绍了语音识别的过程、原理及相关概念的基础之上,介绍了HTK的基本原理和软件结构,以及使用HTK完成语音识别任务的整个过程。最后,讨论声学单元等一系列的模型参数的选择,使用HTK搭建一个简单连续汉语语音输入系统。相似文献

12.

Implementation of Embedded Technology-Based English Speech Identification and Translation System

Zheng Zeng 《计算机系统科学与工程》2020,35(5):377-383

Due to the increase in globalization, communication between different countries has become more and more frequent. Language barriers are the most important issues in communication. Machine translation is limited to texts, and cannot be an adequate substitute for oral communication. In this study, a speech recognition and translation system based on embedded technology was developed for the purpose of English speech recognition and translation. The system adopted the Hidden Markov Model (HMM) and Windows CE operating system. Experiments involving English speech recognition and EnglishChinese translation found that the accuracy of the system in identifying English speech was about 88%, and the accuracy rate of the system in translating English to Chinese was over 85%. The embedded technology-based English speech recognition and translation system demonstrated a level of high accuracy in speech identification and translation, demonstrating its value as a practical application. Therefore, it merits further research and development. 相似文献

13.

重庆方言语音识别系统的设计与实现

张策韦鹏程陆晓燕石熙《计算机测量与控制》2018,26(1)

语音识别赋予了计算机能够识别出语音内容的功能,是人机交互技术领域的重要研究内容。随着计算机技术的发展,语音识别已经得到了成熟的发展。但是关于方言的语音识别还有很大的发展空间。中国是一个幅员辽阔、人口众多的国家,因此方言种类繁多,其中有3000多万人交流使用的重庆方言就是其中之一。采集了重庆方言的部分词语的文本文件和对应的语音文件建立语料库,根据重庆方言的发音特点,选取重庆方言的声韵母作为声学建模基元,选取隐马尔可夫模型(Hidden Markov Model, HMM)为声学模型设计了一个基于HMM的重庆方言语音识别系统。在训练过程利用语料库中训练集语料对声学模型进行训练,形成HMM模型库;在识别过程利用语料库中的测试集语料进行识别测试。实验结果表明,该系统能够实现重庆方言的语音识别,并且识别的正确率为100%。相似文献

14.

手语识别与合成技术在智能建筑中的应用

杨全王民《微计算机信息》2007,23(24):219-221

本文分析了手语识别与合成技术在智能建筑中应用的可能性与意义,分别介绍了手语识别部分与合成部分的主要技术,提出了适用于智能建筑的手语识别、合成系统的结构,并给出了一种手语/语音双向翻译系统在无障碍化智能住宅小区中应用的可行性实例。相似文献

15.

基于语音识别的自动标绘系统设计与实现

下载免费PDF全文

杜修平何丕廉《计算机工程》2006,32(13):190-192

介绍了自动标绘系统的需求和系统流程，并对语音采集、语音识别和自动标绘3个阶段的技术难点及解决方案进行了详细介绍。重点介绍了采用语音自动重叠技术以减少语音切割失误，提高识别精度。描述了对识别出的数字串运用打分系统进行智能切分，提取数据点以提高标绘精度。系统采用VC．NET和SQL Server实现，稳定环境下语音识别精度达到97％以上，标绘正确率达到95％，较好地实现了系统需求。相似文献

16.

一种基于HTK的数字语音识别系统

魏巍张海涛《计算机系统应用》2011,20(9):17-21

数字语音识别是语音识别一个极其重要的分支,其在现实生活中的应用愈加广泛。HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。从HTK的基本原理和软件结构出发,设计了一个基于HTK的数字语音识别系统,并验证了其识别效率。随后,通过更换识别单元,更改特征参数的维数和增加高斯混合分量的个数来考虑不同因素对系统性能的影响。最后,通过比较试验,验证了识别单元、高斯混合分量的数目以及MFCC维数的适当组合可提高系统的正确识别率。相似文献

17.

基于GMM-UBM/SVM的维吾尔语电话语音监控系统

李晓阳伊·达瓦吾守尔·斯拉木勾坂芳典《计算机应用与软件》2012,(1):46-48,77

讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。相似文献

18.

Training Wideband Acoustic Models Using Mixed-Bandwidth Training Data for Speech Recognition

Michael L. Seltzer Alex Acero 《IEEE transactions on audio, speech, and language processing》2007,15(1):235-245

One serious difficulty in the deployment of wideband speech recognition systems for new tasks is the expense in both time and cost of obtaining sufficient training data. A more economical approach is to collect telephone speech and then restrict the application to operate at the telephone bandwidth. However, this generally results in suboptimal performance compared to a wideband recognition system. In this paper, we propose a novel expectation-maximization (EM) algorithm in which wideband acoustic models are trained using a small amount of wideband speech and a larger amount of narrowband speech. We show how this algorithm can be incorporated into the existing training schemes of hidden Markov model (HMM) speech recognizers. Experiments performed using wideband speech and telephone speech demonstrate that the proposed mixed-bandwidth training algorithm results in significant improvements in recognition accuracy over conventional training strategies when the amount of wideband data is limited 相似文献

19.

基于HTK的语音识别系统设计 总被引：3，自引：0，他引：3

石现峰张学智张峰《微机发展》2006,16(10):37-38

HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域。文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及其相应的测试平台,并验证了该语音识别系统的识别率,实验表明,该系统取得了较好的语音输入效果。相似文献