期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何成林杜利民《微计算机应用》2006,27(2):174-176

本文介绍了一种新的电话语音监控系统，该系统利用电话语音卡将通话双方的通话信号采集进计算机，再利用自动语音识别技术对双方的通话内容进行识别，以实现对通话的监控。本文首先分析了该系统的工作流程，并介绍了各主要功能模块的工作原理及其具体实现，最后对系统中各个工作线程之间同步的实现进行了分析。相似文献

2.

综合语音平台系统的研究开发与应用

齐忠吴春英王静曾义《微计算机信息》2006,22(18):244-245

针对语音交换机昂贵的资源和硬件冲突等问题,研究开发了一个综合语音平台,该系统给需要共同使用同一语音交换机上的多种不同语音业务提供一个综合软件平台,实现对硬件交换机逻辑上的封装,使得不同的语音业务能各自独占一个虚拟的交换机,达到结构上的网络分布和资源共享的目的。相似文献

3.

语音识别控制在音频、视频系统中的应用

吴智量陈智昌陈烘华黄镜洪《微计算机信息》2004,20(7):113-114

本系统采用RSC-164单片机作为语音识别芯片．结合时间规整(DTW)技术和结合模块匹配法．对语音频谱信号建立隐含马可夫模型，能识别操作者预先录制的语音命令．命令识别后输出特征信号．通过89C51单片机对输出信号的检测．用位操作的形式实现对音频、视频系统进行语音控制。本系统可以扩展到对其他系统或机器上应用控制。相似文献

4.

基于人工智能的电网调度操作智能防误系统建设及实践

蔡新雷齐颖《电力大数据》2020,23(4)

本文将人工智能算法引入电网调度业务,结合调度规程和指令规范,通过语音识别平台实时转化调度电话为文本信息,对于识别的文字通过语义理解、深度学习提取关键词,识别和探测业务场景。利用提取的关键信息在电网操作平台基于电网实时状态校核、调度业务场景规则进行校核和防误。通过语音平台对于不规范和不正确的调度指令进行告警和提示。通过运行操作历史大数据不断学习发现规律,建立完善的调度业务知识图谱,不断提高语音识别的准确率和场景探测的准确度,进而实现调度电话业务24小时安监的功能。本系统实现了操作全过程状态、潮流等全链条智能防误管控,可解决电话下令时由于监护不到位、下令不规范、调度指令理解错误等情况发生时,调度误下令、误操作问题。相似文献

5.

Microsoft Agent语音技术在Visual Basic中的处理

朱永海李梅陈广宏《计算机工程与设计》2008,29(24)

充分调用Microsoft Agent技术,增添了多媒体应用软件的智能性、趣味性和人性化特征.通过对微软公司Agent角色开发文档及国内外相关文献的研究,分析了Agent的LanguageID、TTSModeID和SRModeID等的语音关键特征.借助于Add()方法和Command事件添加语音命令实现了在VB中自由进行语音识别与输出.另外,必须安装SAPI 4.0运行期支持文件才能在WindowsXP环境下进行输出语音. 相似文献

6.

基于SPCE061A的语音识别系统的研究 总被引：8，自引：3，他引：8

王和顺黄惟公邓成中《计算机工程与设计》2004,25(12):2222-2224

提出了一种基于SPCE061A的语音识别系统，具体分析了其基本原理和主要构成，并对识别方式和程序设计进行了讨论。其语音样本的训练、被识别语音数据的采集及相关处理以及识别结果的输出等都是靠调用库函数来完成。最后，对实验数据进行了分析。相似文献

7.

噪声鲁棒语音识别研究综述* 总被引：3，自引：1，他引：2

雷建军杨震刘刚郭军《计算机应用研究》2009,26(4):1210-1216

针对噪声环境下的语音识别问题,对现有的噪声鲁棒语音识别技术进行讨论,阐述了噪声鲁棒语音识别研究的主要问题,并根据语音识别系统的构成将噪声鲁棒语音识别技术按照信号空间、特征空间和模型空间进行分类总结,分析了各种鲁棒语音识别技术的特点、实现,以及在语音识别中的应用。最后展望了进一步的研究方向。相似文献

8.

基于CORBA的分布式关键词确认系统

王传君张申生王英林《计算机工程》2003,29(5):130-131

将分布式对象计算技术引入到语音识别中，提出了基于CORBA的分布式电话语音关键词确认系统架构，并在基于CTI平台的企业呼叫中心方案中实现了该系统，并对结果进行了分析，证明了该系统的实用性。相似文献

9.

田湾核电站TTS电话语音群发系统研究与设计

王亮刘雪丽《电脑编程技巧与维护》2017,(8)

介绍了基于SS7号信令的多通道电话语音群发系统的设计与实现,在文本语音合成(TTS)、WAV与A率PCM音频格式转换、语音群发、文件监控、客户端与服务端通信机制等方面进行研究,提出了一种基于东进D647 PCI语音板卡的程序设计架构,它通过软件系统实现自定义文本转换成语音,借助语音板卡利用交换机通道实现电话群发功能. 相似文献

10.

语音情感识别研究进展* 总被引：5，自引：1，他引：4

赵腊生张强魏小鹏《计算机应用研究》2009,26(2):428-432

首先介绍了语音情感识别系统的组成,重点对情感特征和识别算法的研究现状进行了综述,分析了主要的语音情感特征,阐述了代表性的语音情感识别算法以及混合模型,并对其进行了分析比较。最后,指出了语音情感识别技术的可能发展趋势。相似文献

11.

采用特征空间随机映射的鲁棒性语音识别

周阿转俞一彪《计算机应用》2012,32(7):2070-2073

针对语音识别性能受噪声干扰而显著降低的问题,提出一种采用特征空间随机映射（RP）的鲁棒性语音语音识别方法,并应用于汽车驾驶环境下的语音识别系统。首先,将原始语音特征参数采用随机矩阵线性映射到新的特征空间,使新的特征参数以最大概率保持原始特征之间距离的同时更加接近于高斯分布;然后训练隐马尔可夫模型(HMM),测试时结合多数投票表决方法对初始模式匹配结果进行判决并得到最终语音识别结果。采用日本情报处理学会车载环境下语音识别数据库CENSREC-2进行实验分析,结果表明,随机映射特征使得汽车驾驶环境下的语音识别性能有了很大改善。相似文献

12.

自闭症干预中无监督自编码的语音情感识别

葛磊强彦赵涓涓《软件学报》2016,27(S2):130-136

语音情感识别是人机交互中重要的研究内容,儿童自闭症干预治疗中的语音情感识别系统有助于自闭症儿童的康复,但是由于目前语音信号中的情感特征多而杂,特征提取本身就是一项具有挑战性的工作,这样不利于整个系统的识别性能.针对这一问题,提出了一种语音情感特征提取算法,利用无监督自编码网络自动学习语音信号中的情感特征,通过构建一个3层的自编码网络提取语音情感特征,把多层编码网络学习完的高层特征作为极限学习机分类器的输入进行分类,其识别率为84.14%,比传统的基于提取人为定义特征的识别方法有所提高. 相似文献

13.

基于多特征i-vector的短语音说话人识别算法

孙念张毅林海波黄超《计算机应用》2018,38(10):2839-2843

当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vector的短语音说话人识别算法。该算法首先提取不同的声学特征向量组合成一个高维特征向量,然后利用主成分分析（PCA）去除高维特征向量的相关性,使特征之间正交化,最后采用线性判别分析（LDA）挑选出最具区分性的特征,并且在一定程度上降低空间维度,从而实现更好的说话人识别性能。结合TIMIT语料库进行实验,同一时长的短语音（2 s）条件下,所提算法比基于i-vector的单一的梅尔频率倒谱系数（MFCC）、线性预测倒谱系数（LPCC）、感知对数面积比系数（PLAR）特征系统在等错误率（EER）上分别有相对72.16%、69.47%和73.62%的下降。不同时长的短语音条件下,所提算法比基于i-vector的单一特征系统在EER和检测代价函数（DCF）上大致都有50%的降低。基于以上两种实验的结果充分表明了所提算法在短语音说话人识别系统中可以充分提取说话人的个性信息,有利地提高说话人识别性能。相似文献

14.

基于增量流形学习的语音情感特征降维方法

下载免费PDF全文

王海鹤陆捷荣詹永照毛启容《计算机工程》2011,37(12):144-146

非线性流形学习可以准确反映现实非线性数据本质并进行较好的降维,但在语音情感识别过程中难以有效处理不断增加的语音数据集,也不能充分利用训练过程中的情感特征信息。针对上述情况,提出一种基于增量流形学习的语音情感特征降维方法。该方法利用等距映射将训练样本特征维数降至目标维数后,通过增量流形学习的方法分批求得测试样本的低维特征。实验结果表明,相比同类方法,该方法具有较低的运算复杂度和较高的识别率。相似文献

15.

基于短时能量—LPCC的语音特征提取方法研究

王钟斐王彪《计算机与数字工程》2012,40(11):79-80,127

为了提高语音信号的识别率,提出了一种基于短时能量—LPCC的语音特征提取方法。该方法在LPCC参数的基础上,增加每帧信号的短时能量信息,使得新参数能够更为准确的表征语音信号。通过仿真实验,说明了新特征参数取得了较高的识别率。相似文献

16.

新型车载语音识别系统中的一种关键技术

刘筠卢超《微处理机》2008,29(4)

提出一种新型车载语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别。同时提出了一种新的抗噪语音识别方法,改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好的抑制了噪声干扰,提高了语音识别率。相似文献

17.

基于MUSIC/MNM谱估计的鲁棒语音特征提取

张毅汪培培罗元《信息与控制》2016,45(3):355-360

针对语音识别系统受噪声干扰识别率急剧下降的问题,通过分析传统的鲁棒语音特征提取方法在语音信号谱估计方面的不足,提出一种在不同信噪比下都具有较好鲁棒性和识别性能的语音特征提取算法．该算法结合多信号分类法（MUSIC）和最小模法（minimum-norm method,MNM）来进行谱估计．接着在移动机器人平台上进行验证实验,结果表明：该算法能有效的提高语音识别率,增强语音识别鲁棒性能．相似文献

18.

VTS特征补偿算法在语音识别中的实用性研究

杨钊杜俊胡郁刘庆峰戴礼荣《小型微型计算机系统》2011,32(4)

在语音识别实际应用中,由于噪声的多样性,会造成训练和测试的失配,导致系统性能下降.特征补偿作为鲁棒性语音识别的一种重要方法,通过对训练和测试环境之间差异的研究,在特征空间中修正语音特征,使得修正后的测试语音特征能够更加接近训练语音特征.本文介绍一种实用的基于环境模型矢量泰勒级数(VTS)近似的特征补偿算法.首先验证传统的VTS离线算法在实际车载环境下的有效性;其次由于离线算法本身运算量很大,为了使其实用化,本文对算法进行改进,使其在提高效率的同时又能够保证与离线时相当的性能.通过实验结果验证,本文提出的实用化VTS算法在识别性能上相当接近离线时最好的性能. 相似文献

19.

抗噪声语音识别及语音增强算法的应用 总被引：1，自引：0，他引：1

汤玲戴斌《计算机仿真》2006,23(9):80-82,143

提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降，为了让语音识别系统在含噪的环境下获得令人满意的工作性能，该文根据人耳听觉特性提出了一种鲁棒语音特征提取方法。在MFCC特征提取之前先对含噪语音特征进行掩蔽特性处理，同时结合语音增强方法对特征进行处理，最后得到鲁棒语音特征。通过4种不同试验结果分析表明，将这种方法用于抗噪声分析可以提高系统的抗噪声能力；同时这种特征的处理方法对不同噪声在不同信噪比有很好的适应性。相似文献

20.

Statistical feature evaluation for classification of stressed speech

H. Patro G. Senthil Raja S. Dandapat 《International Journal of Speech Technology》2007,10(2-3):143-152

The variations in speech production due to stress have an adverse affect on the performances of speech and speaker recognition algorithms. In this work, different speech features, such as Sinusoidal Frequency Features (SFF), Sinusoidal Amplitude Features (SAF), Cepstral Coefficients (CC) and Mel Frequency Cepstral Coefficients (MFCC), are evaluated to find out their relative effectiveness to represent the stressed speech. Different statistical feature evaluation techniques, such as Probability density characteristics, F-ratio test, Kolmogorov-Smirnov test (KS test) and Vector Quantization (VQ) classifier are used to assess the performances of the speech features. Four different stressed conditions, Neutral, Compassionate, Anger and Happy are tested. The stressed speech database used in this work consists of 600 stressed speech files which are recorded from 30 speakers. SAF shows maximum recognition result followed by SFF, MFCC and CC respectively with the VQ classifier. The relative classification results and the relative magnitudes of F-ratio values for SFF, MFCC and CC features are obtained with the same order. SFF and MFCC feature show consistent relative performance for all the three tests, F-ratio, K-S test and VQ classifier. 相似文献