首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 135 毫秒
1.
基于DSP的语音处理系统设计   总被引:2,自引:2,他引:2  
介绍了一种较强背景噪声下工作的语音处理系统.其语音采集部分由FPGA控制PCM语音编码器完成,语音增强部分以TMS320VC5402为核心实现.文章讨论了系统硬件设计、语音增强算法的原理及其DSP实现,给出了软件流程及实验结果.  相似文献   

2.
本文描述了应用TI公司的TMS320C54x系列DSP实现语音增强算法.介绍了谱减法及其改进型算法的原理,并具体说明了语音增强算法的DSP实现过程.试验结果表明,算法可以有效地抑制噪声,提高信噪比,减少失真.  相似文献   

3.
针对嵌入式操作系统不能满足对语音的实时处理以及DSP对文件、界面处理能力弱等不足,提出了一种嵌入式系统中的DSP语音协处理器的设计方案。该语音协处理器采用专业的DSP芯片、并且提供标准的PCI接口。该语音协处理器能够作为一种标准语音处理设备应用于嵌入式系统或PC机中。  相似文献   

4.
谭伟  马琪 《机电工程》2010,27(11):71-74,126
针对目前语音编码器多采用DSP实现,而DSP处理器成本相对较高的弊端,提出了一种能在国内自主知识产权32位嵌入式CPU—CK510/520平台上实现宽带语音实时编、解码的设计方案。首先,研究了基于重叠调制变换技术的宽带语音编解码算法G.722.1;然后综合该算法原理和CK-CPU特性,对算法作了基于C语言和汇编语言的各种优化,使得算法程序更适合于硬件实现。实验结果表明,优化后的定点G.722.1编码器的算法复杂度得到有效降低,节约了内存空间,并取得了较好的语音重建效果。该研究成果不仅有助于形成基于单CPU的比较简单和低廉的语音、编解码应用解决方案,也有利于国产嵌入式CPU在语音领域的应用推广。  相似文献   

5.
系统采用TMS320C5402作为核心处理器,完成了多通道数据采集、DSP数据处理、键盘显示、CPLD与凌阳单片机外围接口等关键模块的软硬件设计,给出了系统的工作原理、硬件结构及软件流程.在硬件方面,重点介绍了显示电路和以DSP与CPLD为核心的电力参数检测电路;在软件方面进行了相关软件算法设计,系统采用128点离散采样,由DSP进行基-2FFT运算,同时介绍了电力参数检测的主程序,并实现了语音提示功能和更加人性化的操作显示界面.  相似文献   

6.
基于DSP的G.729A编解码的实时实现   总被引:1,自引:0,他引:1  
针对实时语音信号的处理和应用,提出了基于可编程DSP芯片和算法的实现方案。分析G.729A编码和解码算法的实现原理,构建TMS320VC5416处理器和TLV320AIC23语音芯片相结合的语音处理硬件平台。通过设计系统应用软件,配置McBSP连接和数据传输,控制音频信号转换处理,优化编写编解码算法程序。最后调试实现了音频信号采集、播放和语音数据编解码功能。实验结果表明该方法是有效和可行的。  相似文献   

7.
随着语音处理技术研究的不断深入和语音处理应用要求的不断提高,语音处理系统需要按实时方式工作。该文采用TMS320VC5416DSP和TLV320AIC23Codec组成实时语音增强系统,实现了语音信号的增强处理,并对设计中所涉及到的关键技术和解决方案进行了详细分析和说明。  相似文献   

8.
本文提出了用DSP5402进行语音处理的方法,详细介绍了系统的软硬件结构与原理.该语音处理系统已安装于某监狱监控系统中,实际运行效果良好.  相似文献   

9.
设计了一种基于uClinux的语音数据采集系统,给出了以ARM、DSP为核心的硬件平台结构,并结合语音设备驱动程序介绍了uClinux嵌入式操作系统下内核设备驱动程序的设计方法.  相似文献   

10.
设计了一种基于uClinux的语音数据采集系统,给出了以ARM、DSP为核心的硬件平台结构,并结合语音设备驱动程序介绍了uClinux嵌入式操作系统下内核设备驱动程序的设计方法.  相似文献   

11.
This paper touches upon a model of simultaneous acoustic masking, which detects speech signal components perceived by a human’s auditory system. A simultaneous masking algorithm on the basis of this model is proposed. It is shown that, after simultaneous masking, a signal becomes a binary structure that reflects the harmonic structure of a vocalized sequence. It is experimentally proven that this structure can be used to detect key speech segments (from the standpoint of perception by an auditory system). This structure serves as a basis for an algorithm of high-quality segmentation of a speech signal into vocalized and unvocalized segments, which does not require learning before use. The joint use of the algorithms for simultaneous masking and speech signal segmentation is tested, and their performance is evaluated.  相似文献   

12.
The Autoregressive Moving Average (ARMA) model for whispered speech is proposed. Compared with normal speech, whispered speech has no fundamental frequency because of the glottis being semi-opened and turbulent flow being created, and formant shifting exists in the lower frequency region due to the narrowing of the tract in the false vocal fold regions and weak acoustic coupling with the subglottal system. Analysis shows that the effect of the subglottal system is to introduce additional pole-zero pairs into the vocal tract transfer function. Theoretically, the method based on an ARMA process is superior to that based on an AR process in the spectral analysis of the whispered speech. Two methods, the least squared modified Yule-Walker likelihood estimate (LSMY) algorithm and the Frequency-Domain Steiglitz-Mcbride (FDSM) algorithm, are applied to the ARMA model for the whispered speech. The performance evaluation shows that the ARMA model is much more appropriate for representing the whispered speech than the AR model, and the FDSM algorithm provides a more accurate estimation of the whispered speech spectral envelope than the LSMY algorithm with higher computational complexity.  相似文献   

13.
智能考勤系统在企业对员工的出勤考查中具有十分重要的作用。为了提高语音考勤系统的准确性,提出基于稀疏表示的说话人识别算法。该算法在通用背景模型的基础上提取说话人语音的高斯混合模型超向量,采用线性判别分析技术对超向量进行信道补偿和降维,再由低维超向量形成稀疏表示的过完备字典。根据话者测试语音在过完备字典上的重构误差,对话者的身份进行验证。实验结果表明,基于稀疏表示分类的语音考勤系统具有良好的性能。  相似文献   

14.
应用动态时间规整(DTW)为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用MATLAB图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。  相似文献   

15.
基于经验模态分解和Teager峭度的语音端点检测   总被引:7,自引:2,他引:5  
采用经验模态分解和Teager峭度的统计特性对噪声环境下的语音信号端点进行检测。利用经验模态分解获得语音信号的本征模态函数,用Teager能量算子计算每个本征模态函数的瞬时能量,并对本征模态函数进行系数—峭度计算,提取信号期望的统计特征信息实现语音端点的检测。通过自适应EMD分解和Teager能量算子的处理,这种方法可以有效地消除白噪声或有色高斯噪声的影响。通过仿真例子说明这种方法可以取得良好的端点检测效果,仿真研究结果表明用经验模态分解和Teager峭度对噪声环境下的语音端点检测是可行的和有效的,提高了检测的可靠性。  相似文献   

16.
结点阈值小波包变换语音增强新算法   总被引:1,自引:0,他引:1  
人耳频率分辨率是非线性的,而小波包算法有灵活的时频分析能力,可较好的模拟人耳基底膜的频率分析特性。本文提出了一种新的基于结点阈值的小波包变换语音增强算法。采用Bark尺度小波包对含噪语音进行分解,在语音信号的子带层次上进行阈值操作,并采用软阈值方法进行阈值处理。采用谱熵法估计结点噪声。实验表明,该算法在多种噪声,尤其是有色噪声和非平稳噪声条件下均有较好的语音增强效果。  相似文献   

17.
提出了基于语音识别及自然语言处理的人机对话智能交互方法.分析了人工智能技术以及语音交互在电力系统中的应用和发展趋势.通过自然语言处理技术和基于具体应用语境的自然语言处理技术,提出人机智能语音交互的关键和重点.建立基于语音识别的人机交互模型,提出梯度提升、支持向量机和k最近邻等关键性算法,并搭建人机交互模型架构.提出自动语音识别算法,并说明语言模型和声学模型的具体交互原理.  相似文献   

18.
基于SPCE061A智能小车机器人语音播放系统的研究   总被引:1,自引:0,他引:1  
设计了基于SPCE061A控制器的智能小车机器人语音播放系统,介绍了SPCE061A的内部资源和语音播放原理,详细阐述了系统的硬件基础,并以流程图的形式描述了通过调用语音函数库中的函数开发语音播放系统的过程.实验结果表明,使用8kHz的采样率时,智能小车语音播放系统运行良好.  相似文献   

19.
This paper presents a speech enhancement system that enables a comfortable communication inside an automobile. A couple of novel concepts are proposed in an effort to improve two major building blocks in the existing speech enhancement systems: a voice activity detector (VAD) and a noise filtering algorithm. The proposed VAD classifies a given data frame as speech or noise at each frequency, enabling the frequency-wise updates of noise statistics and thereby improving the effectiveness of the noise filtering algorithms by providing more up-to-date noise statistics. The celebrated Wiener filter is adopted in this paper as the accompanying noise filtering algorithm, which results in significant noise suppression. Yet, the musical noise present in most Wiener filter-based systems prompts the idea of applying the Wiener filter in the Mel-scale in which the human auditory system responds to the external stimulation. It turns out that the Mel-scale Wiener filter creates some masking effects and thereby reduces musical noise significantly, leading to smooth transition between data frames.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号