首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
基于听觉模型的汉语耳语音声调检测   总被引:1,自引:1,他引:0  
陈雪勤  赵鹤鸣 《电子学报》2009,37(4):864-867
 从听觉感知出发,分析了听觉外周模型对于语音激励的主要响应过程,采取听神经平均发放率为声调感知线索,提出了一种汉语耳语音声调的识别方法.其理论基础是听神经发放信息是听觉中枢的唯一信息来源,它是对于语音激励中声强、频谱、共振峰等多种特征的综合反应,因此适合用作耳语音的声调特征.采用BP神经网络对大量汉语元音耳语四声样本进行训练、识别,得到65.1%的平均识别率,达到了改善汉语耳语音声调识别效果的目的.  相似文献   

2.
赵力 《电子器件》2012,35(6):699-703
提出了一种基于改进混合蛙跳算法的SVM训练算法。该算法保持了混合蛙跳算法参数少和容易实现的特点,同时通过模拟退火的降温过程来提高算法的进化速度和精度。并用耳语情感语音识别实验来验证提出的基于改进混合蛙跳算法的SVM的有效性。实验结果表明,提出的新的模型的实验结果明显好于传统的SVM方法,证明了该方法的有效性。  相似文献   

3.
耳语音声调特征的研究   总被引:9,自引:0,他引:9  
介绍了耳语音的声学特性,在没有基频的情况下,通过人耳听觉实验验证了孤立的耳语音节是带有声调信息的,并得出幅值包络和音长都是耳语音声调的重要特征。  相似文献   

4.
本文提出了一种新的基于GMM和非均匀线性预测倒谱系数(NLPC)的客观语,音质量评估方法.首先,通过Bark双线性变换(BBT)对线性频谱进行频谱弯折,弯折后的频谱符合人耳听觉感知的非均匀特性.然后通过对非均匀谱的线性预测计算出NLPC.提取参考语音的NLPC用来对高斯混合模型进行训练.通过训练对参考语音建立参考模型.由参考模型和失真语音的NLPC向量可以得到它们之间的一致性测度.最后,通过多元自适应回归样条函数建立主观MOS分和一致性测度之间的映射关系,可以得到对MOS分的客观预测模型.通过这一模型进行语音质量的客观评价.实验表明,提出算法的性能要好于ITU-T P.563标准中的算法.  相似文献   

5.
该文给出了发射端固定的单发多收地球同步轨道(GEO)星机多基SAR几何模型,推导了不同接收端回波之间的频谱偏移.基于该频谱偏移,提出了通过合成不同接收端的频谱实现提高距离分辨率的方法.详细分析了谱合成过程中产生的重叠干扰项,及其对距离分辨率的影响,并提出了权值滤波的方法进行抑制.最后通过仿真验证了方法的有效性.  相似文献   

6.
基于多通道频谱重构的方位解模糊技术是解决星载合成孔径雷达成像中方位分辨率和成像幅宽之间矛盾的重要方法。文中在多通道频谱重构原理的基础上,分析了为实现频谱重构,信号带宽、采样频率及通道数之间应满足的定量关系,提出了通过加窗处理的方法抑制冗余频谱周期对频谱重构的干扰,分析了通道间距对频谱重构结果的影响,并利用延时错位选取成像的脉冲的方法减小了通道间距对重构频谱的影响。通过上述多通道频谱重构中的关键问题的研究,为该技术应用于工程实践奠定了基础。  相似文献   

7.
对微球腔耳语回廊模式下的谐振特性所表现出的光学非线性进行了分析,对直径1 mm的SiO2微球腔的谐振谱线和解调曲线进行了仿真;搭建了微球腔耦合测试系统,得到了微球腔半高全宽值为78.42 MHz、Q值为2.5106的谐振谱线;基于正弦波相位调制技术对谐振谱线进行了同步解调,以减小相位复位脉冲噪声的影响;采用环路锁频技术实现了谐振频率的跟踪和锁定,对锁定精度和锁定时间进行了分析,实验结果为锁定透射谱强度至1%的时间为8 ms,锁定后可测频移分辨率为375 kHz,为微球腔的传感测量提供了实验依据。  相似文献   

8.
针对源说话人与目标说话人之间声学差异过大影响语音转换效果的问题,提出一种基于声道归一化调整的语音转换方法。该方法通过STRAIGHT分析-合成模型提取说话人的个性化特征参数。在频谱训练阶段,对已提取的Mel频率倒谱系数利用声道归一化和高斯混合模型的方法进行训练映射。主观听音测试证明,该方法的转换效果优于传统的不使用声道归一化的高斯混合模型。  相似文献   

9.
徐华平  周荫清  李春升 《电子学报》2003,31(12):1790-1794
分布式星载SAR利用不同视角回波信号之间地面散射频谱不同的特性来提高SAR图像的距离向分辨率.其数据处理的关键就是如何将这些不同频段的信号相结合,得到具有更宽频谱的高分辨率图像.本文提出了一种基于频谱偏移估计的分布式星载SAR提高距离向SAR图像分辨率的数据处理方法.该方法的主要思想是在SAR复图像的基础上,通过精确的估计,得到SAR复图像间的距离向频谱偏移量,并根据该偏移量,在频域进行距离向频谱偏移补偿后将图像相加.建立了分布式星载SAR单视复图像的信号模型,推导了基于频谱偏移估计提高SAR图像距离向分辨率的原理公式,给出了基于频谱偏移估计提高距离向分辨率的具体数据处理步骤.最后采用仿真数据验证了理论推导的正确性和数据处理方法的有效性.  相似文献   

10.
汉语耳语音转换为正常音的研究   总被引:1,自引:0,他引:1  
樊星  卢晶  徐柏龄 《电声技术》2005,(12):44-47
耳语音转换为正常音,可应用于公共场所的通信、失语者的语音恢复和司法工作的某些特殊需要等方面。由于耳语发音和正常音在激励源和声道传递函数上存在差异,所以一般的语音合成方法不再适用。分析了耳语音的发音及声学特点,初步建立了一个基于同态信号处理方法并结合相对熵声韵分割的耳语音重建系统,入耳对恢复出的正常音可以正确分辨。  相似文献   

11.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。  相似文献   

12.
孙静  陶智  顾济华  赵鹤鸣 《通信技术》2007,40(12):394-396
文中针对带噪的耳语音提出了一种LMS自适应滤波的耳语音增强算法。首先采用谱减法得到一个增强耳语音信号,取得较好的谱包络后对增强信号进行LMS自适应滤波,消除由谱减法产生的音乐噪声。结果表明,采集到的耳语音信号的质量得到明显提高,即使在低信噪比的情况下,信噪比也能提高20dB左右。  相似文献   

13.
谈雪丹  顾济华  赵鹤鸣  陶智  沈圆圆 《通信技术》2010,43(6):207-209,212
提出了一种基于希尔伯特-黄变换瞬时能频值的含噪耳语音声韵分割算法。根据耳语音声韵母幅频特性,运用HHT,分离出耳语音中高频部分的瞬时幅值与频率,同步去除低频噪声,提取出能够反映声韵母过渡信息的特征参数——瞬时能频值,利用该参数对耳语音进行声韵分割。实验结果表明:与相对熵算法相比,该算法对含噪耳语音进行的声韵分割正确率较高,能够较准确地进行耳语音声韵分割。  相似文献   

14.
An improved method based on minimum mean square error-short time spectral amplitude (MMSE-STSA) is proposed to cancel background noise in whispered speech. Using the acoustic character of whispered speech, the algorithm can track the change of non-stationary background noise effectively. Compared with original MMSE-STSA algorithm and method in selectable mode Vo-coder (SMV), the improved algorithm can further suppress the residual noise for low signal-to-noise radio (SNR) and avoid the excessive suppression. Simulations show that under the non-stationary noisy environment, the proposed algorithm can not only get a better performance in enhancement, but also reduce the speech distortion.  相似文献   

15.
赵越  林玮 《电声技术》2016,40(11):48-52
耳语音的声学特征是研究其语音识别和说话人识别的重要组成部分.介绍了耳语音的特点并讨论了其声学特征.由于耳语音没有基频,所以共振峰与音长特性可以作为重要的声学参数用于识别.对汉语6个耳语音元音进行了分析研究,证明共振峰频率和音长可以作为耳语音识别的特征参数.  相似文献   

16.
耳语音是一种语言方式,是指声带轻微振动或者不振动的轻声说话。本文对已经收集形成的语音库的基础之上进行了一系列研究,在此基础上就正常音和耳语音对共振峰位置带宽进行研究计算,得出其相应的变化比例,最终获得了耳语音在共振峰的基本特点。  相似文献   

17.
根据音素发音时语谱结构的变化提出了一种基于语谱能量的音素边界检测方法。该方法首先根据语谱结构变化特点将信号频域划分为高频、中频、低频3个区域,并以语音帧间语谱能量向量的欧氏距离为判别依据分别对3个区域进行音素边界检测,然后对3个区域检测的边界分别进行二次筛选,最后将3个区域的边界信息融合,得到音素边界检测结果,相对于基于音素属性的边界检测方法,计算复杂性大大降低,边界检测率提高了3.95%。  相似文献   

18.
This paper presents the results on whispered speech recognition using gammatone filterbank cepstral coefficients for speaker dependent mode. The isolated words used for this experiment are taken from the Whi-Spe database. Whispered speech recognition is based on dynamic time warping and hidden Markov models methods. The experiments are focused on the following modes: normal speech, whispered speech and their combinations (normal/whispered and whispered/normal). The results demonstrated an important improvement in recognition after application of cepstral mean subtraction, especially in mixed train/test scenarios.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号