共查询到19条相似文献,搜索用时 218 毫秒
1.
分别从系统总体设计、系统硬件等方面详细研究基于ARM的语音识别系统。阐述基于一款ARM9微处理器(s3c2410)的嵌入式语音识别系统的解决方案,硬件部分主要包括电源部分、复位部分、时钟电路等。 相似文献
2.
采用语音识别进行人机交互是人类进行信息交换的一种最有效的方式。本文首先介绍了语音识别技术的原理,并采用AVR单片机和LD3320语音识别芯片设计了一种玩具娃娃语音识别系统。该系统所用器件少,语音资源可刷新,具有很大的灵活性和扩展性。 相似文献
3.
在分析语音识别原理的基础上设计了一个基于ARM9和嵌入式Linux的嵌入式语音识别系统采用隐马尔可夫(HMM)算法对语音信号进行特征参数序列比较并识别出结果。语音识别子系统由ARM和DSP芯片为核心,配合其他功能电路,能够独立完成语音识别的工作. 相似文献
4.
介绍DELPHI实现板卡式招生电话语音应答系统的方法,并详细描述动态链接库的导入、自动语音应答功能模块和语音应答流程方案编辑模块的实现过程。该系统经过应用,证明效率高,性价比高,具有一定的可推广性。 相似文献
5.
6.
对语音信号进行预处理,包括预滤波、采样、量化、分帧、加窗以及端点检测等内容:采用能够反映人对语音信号的感知特性的Mel频率倒谱系数作为语音信号的特征参数:应用目前在语音识别中广泛应用的技术——动态时间规整技术作为识别算法。测试结果表明,利用该技术进行语音识别,准确率可达到95%以上,识别效果良好。 相似文献
7.
8.
一、IP电话简介IP电话,更准确地说应该是数据网络电话。IP(Internet Protocol)本来只是Internet的网络层协议和重要的技术基础。由于它代表了无连接通信方式的本质特性,成为区别于传统通信方式的基本标志。语音信息由固定电话或手机通过本地程控交换机或移动交换机进入因特网并转换成数字信号,以一个个数据包的形式在因特网中传输。这是一个路由器加专线(光缆)的存储转发型网络。IP协议实质上 相似文献
9.
智能时代已经来临,但是如何让电视机智能化目前仍是一个热门的课题。从本地服务到云端服务,从2D界面到3D界面,从按键操作到手势操作和语音操作等等,这些都是人们在电视机智能化过程中所做的努力。而本文将重点讲述智能语音控制技术在电视机中的研究和应用。 相似文献
10.
神经网络方法及其在语音识别中的应用 总被引:2,自引:0,他引:2
讨论了神经网络技术用于汉语语音信号的端点检测,声,韵母分离、非线性特征抽取和大字表识别的方法,描述了系统实现框图并给出了应用实例。 相似文献
11.
Speech recognition, which remained on the fringes of commercial interest for many years, came into prominence recently due
to the support extended to this research area by the Advanced Research Projects Agency of theusa. More recently, this area of research has received added impetus due to the priority assigned to the development of fifth
generation computers by Japan and several other countries of the world and the importance of speech input/output systems therein.
India has a long tradition of good quality work in this area. In this paper, we present a brief overview of different aspects
of automatic speech recognition research and present the state-of-the art in this area. We cover the world trends in this
area of research, with special attention to work done in India. 相似文献
12.
单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。 相似文献
13.
鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(Equivalent Rectangular Bandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。 相似文献
14.
针对聋哑人与正常人之间存在的交流障碍问题,提出了一种融合人脸表情的手语到汉藏双语情感语音转换的方法。首先使用深度置信网络模型得到手势图像的特征信息,并通过深度神经网络模型得到人脸信息的表情特征。其次采用支持向量机对手势特征和人脸表情特征分别进行相应模型的训练及分类,根据识别出的手势信息和人脸表情信息分别获得手势文本及相应的情感标签。同时,利用普通话情感训练语料,采用说话人自适应训练方法,实现了一个基于隐Markov模型的情感语音合成系统。最后,利用识别获得的手势文本和情感标签,将手势及人脸表情转换为普通话或藏语的情感语音。客观评测表明,静态手势的识别率为92.8%,在扩充的Cohn-Kanade数据库和日本女性面部表情(Japanese Female Facial Expression,JAFFE)数据库上的人脸表情识别率为94.6%及80.3%。主观评测表明,转换获得的情感语音平均情感主观评定得分4.0分,利用三维情绪模型(Pleasure-Arousal-Dominance,PAD)分别评测人脸表情和合成的情感语音的PAD值,两者具有很高的相似度,表明合成的情感语音能够表达人脸表情的情感。 相似文献
15.
本文提出一种符合高维几何空间理论的矩阵体积度量分类准则用于人脸识别.基于二维PCA的人脸识别方法主要研究的是特征提取部分,对后继的分类识别研究不多.基于二维PCA的人脸识别方法中典型的分类准则是比较特征向量的欧氏距离,而新方法比较的是矩阵的体积.在ORL和AR人脸库上的实验表明,所提出的矩阵体积度量较传统距离度量分类准则更有效. 相似文献
16.
Hsien-Cheng Liao 《中国工程学刊》2016,39(5):574-577
This paper proposes a maximum confidence measure-based closed-loop dual-microphone beamforming direction and beamwidth steering algorithm to facilitate robust speech recognition. This technique involves feeding back the confidence measure reported through a back-end speech recognizer, automatically steering a front-end microphone array to optimally identify the correct speaker direction and array beamwidth. The technique enables users to move around freely and directly improves overall system performance. The experimental results from a voice command task show that the proposed approach demonstrated superior performance. 相似文献
17.
18.
19.
Abstract In a large vocabulary continuous speech recognition system, to efficiently decrease parameter size and improve the robustness of parameter training, a parameter clustering method by fuzzy clustering is proposed. Based on the structure of the phonetic decision tree, leaf nodes are used for Gaussian clustering and root nodes or shallow leaf nodes are used for covariance sharing. Experimental results show that when the number of Gaussians is reduced by 50%, recognition accuracy only decreases by 0.55%. By combining fuzzy covariance sharing, a total of 4.16% in recognition increase is achieved over the conventional system with approximately the same parameter size. 相似文献