共查询到18条相似文献,搜索用时 125 毫秒
1.
基于听觉模型的汉语耳语音声调检测 总被引:1,自引:1,他引:0
从听觉感知出发,分析了听觉外周模型对于语音激励的主要响应过程,采取听神经平均发放率为声调感知线索,提出了一种汉语耳语音声调的识别方法.其理论基础是听神经发放信息是听觉中枢的唯一信息来源,它是对于语音激励中声强、频谱、共振峰等多种特征的综合反应,因此适合用作耳语音的声调特征.采用BP神经网络对大量汉语元音耳语四声样本进行训练、识别,得到65.1%的平均识别率,达到了改善汉语耳语音声调识别效果的目的. 相似文献
2.
提出了一种基于改进混合蛙跳算法的SVM训练算法。该算法保持了混合蛙跳算法参数少和容易实现的特点,同时通过模拟退火的降温过程来提高算法的进化速度和精度。并用耳语情感语音识别实验来验证提出的基于改进混合蛙跳算法的SVM的有效性。实验结果表明,提出的新的模型的实验结果明显好于传统的SVM方法,证明了该方法的有效性。 相似文献
3.
4.
本文提出了一种新的基于GMM和非均匀线性预测倒谱系数(NLPC)的客观语,音质量评估方法.首先,通过Bark双线性变换(BBT)对线性频谱进行频谱弯折,弯折后的频谱符合人耳听觉感知的非均匀特性.然后通过对非均匀谱的线性预测计算出NLPC.提取参考语音的NLPC用来对高斯混合模型进行训练.通过训练对参考语音建立参考模型.由参考模型和失真语音的NLPC向量可以得到它们之间的一致性测度.最后,通过多元自适应回归样条函数建立主观MOS分和一致性测度之间的映射关系,可以得到对MOS分的客观预测模型.通过这一模型进行语音质量的客观评价.实验表明,提出算法的性能要好于ITU-T P.563标准中的算法. 相似文献
5.
6.
7.
对微球腔耳语回廊模式下的谐振特性所表现出的光学非线性进行了分析,对直径1 mm的SiO2微球腔的谐振谱线和解调曲线进行了仿真;搭建了微球腔耦合测试系统,得到了微球腔半高全宽值为78.42 MHz、Q值为2.5106的谐振谱线;基于正弦波相位调制技术对谐振谱线进行了同步解调,以减小相位复位脉冲噪声的影响;采用环路锁频技术实现了谐振频率的跟踪和锁定,对锁定精度和锁定时间进行了分析,实验结果为锁定透射谱强度至1%的时间为8 ms,锁定后可测频移分辨率为375 kHz,为微球腔的传感测量提供了实验依据。 相似文献
8.
针对源说话人与目标说话人之间声学差异过大影响语音转换效果的问题,提出一种基于声道归一化调整的语音转换方法。该方法通过STRAIGHT分析-合成模型提取说话人的个性化特征参数。在频谱训练阶段,对已提取的Mel频率倒谱系数利用声道归一化和高斯混合模型的方法进行训练映射。主观听音测试证明,该方法的转换效果优于传统的不使用声道归一化的高斯混合模型。 相似文献
9.
分布式星载SAR利用不同视角回波信号之间地面散射频谱不同的特性来提高SAR图像的距离向分辨率.其数据处理的关键就是如何将这些不同频段的信号相结合,得到具有更宽频谱的高分辨率图像.本文提出了一种基于频谱偏移估计的分布式星载SAR提高距离向SAR图像分辨率的数据处理方法.该方法的主要思想是在SAR复图像的基础上,通过精确的估计,得到SAR复图像间的距离向频谱偏移量,并根据该偏移量,在频域进行距离向频谱偏移补偿后将图像相加.建立了分布式星载SAR单视复图像的信号模型,推导了基于频谱偏移估计提高SAR图像距离向分辨率的原理公式,给出了基于频谱偏移估计提高距离向分辨率的具体数据处理步骤.最后采用仿真数据验证了理论推导的正确性和数据处理方法的有效性. 相似文献
10.
11.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。 相似文献
12.
13.
14.
An improved method based on minimum mean square error-short time spectral amplitude (MMSE-STSA) is proposed to cancel background noise in whispered speech. Using the acoustic character of whispered speech, the algorithm can track the change of non-stationary background noise effectively. Compared with original MMSE-STSA algorithm and method in selectable mode Vo-coder (SMV), the improved algorithm can further suppress the residual noise for low signal-to-noise radio (SNR) and avoid the excessive suppression. Simulations show that under the non-stationary noisy environment, the proposed algorithm can not only get a better performance in enhancement, but also reduce the speech distortion. 相似文献
15.
耳语音的声学特征是研究其语音识别和说话人识别的重要组成部分.介绍了耳语音的特点并讨论了其声学特征.由于耳语音没有基频,所以共振峰与音长特性可以作为重要的声学参数用于识别.对汉语6个耳语音元音进行了分析研究,证明共振峰频率和音长可以作为耳语音识别的特征参数. 相似文献
16.
耳语音是一种语言方式,是指声带轻微振动或者不振动的轻声说话。本文对已经收集形成的语音库的基础之上进行了一系列研究,在此基础上就正常音和耳语音对共振峰位置带宽进行研究计算,得出其相应的变化比例,最终获得了耳语音在共振峰的基本特点。 相似文献
17.
根据音素发音时语谱结构的变化提出了一种基于语谱能量的音素边界检测方法。该方法首先根据语谱结构变化特点将信号频域划分为高频、中频、低频3个区域,并以语音帧间语谱能量向量的欧氏距离为判别依据分别对3个区域进行音素边界检测,然后对3个区域检测的边界分别进行二次筛选,最后将3个区域的边界信息融合,得到音素边界检测结果,相对于基于音素属性的边界检测方法,计算复杂性大大降低,边界检测率提高了3.95%。 相似文献
18.
B. Marković J. Galić Ð. Grozdić S. T. Jovičić M. Mijić 《Journal of Communications Technology and Electronics》2017,62(11):1255-1261
This paper presents the results on whispered speech recognition using gammatone filterbank cepstral coefficients for speaker dependent mode. The isolated words used for this experiment are taken from the Whi-Spe database. Whispered speech recognition is based on dynamic time warping and hidden Markov models methods. The experiments are focused on the following modes: normal speech, whispered speech and their combinations (normal/whispered and whispered/normal). The results demonstrated an important improvement in recognition after application of cepstral mean subtraction, especially in mixed train/test scenarios. 相似文献