首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
2.
通过对腭裂语音发声模型进行研究,提出基于激励、声道、辐射模型特征参数的腭裂语音高鼻音等级自动识别算法。通过对基于激励模型的基音频率、基于声道模型的共振峰参数、基于综合发声模型的短时能量和M el倒频谱系数等表征高鼻音特性的参数进行分析和改进,以K‐最近邻算法为模式识别分类器,得出应用4种特征参数的高鼻音等级自动识别结果。实验结果表明, M el倒频谱系数与腭裂语音临床生理特征相关性最大,对不同等级高鼻音识别率最高。  相似文献   

3.
腭裂语音高鼻音等级的自动识别能为临床腭咽功能评估提供有效、客观、无创的辅助依据。对腭裂语音高鼻音等级自动分类系统进行了研究,利用听觉模型提取语音信号的听觉内部表达,并结合同步检测器提取软限制比(Soft Limited Ratio,SLR)谱特征作为特征参数,利用一对一支持向量机(1-v-1 Support Vector Machine,1-v-1 SVM)实现腭裂语音高鼻音四类等级(正常、轻度、中度和重度)的自动划分。实验采用56名儿童的共3 086个语音样本,并对比了使用不同基底膜滤波器种类和个数,使用同步检测器和侧抑制网络对识别效果的影响。实验结果表明,使用基于等效矩阵带宽(Equivalent Rectangular Bandwidth,ERB)尺度的Gammatone滤波器的识别效果优于基于Bark尺度的小波包滤波器;54个通道的滤波器能有效权衡算法时间成本和识别正确率;使用同步检测器提取SLR谱特征的识别效果优于侧抑制网络提取的LIN(Lateral Inhibition Network)谱特征。腭裂语音高鼻音四类等级自动识别系统最高分类正确率达91.50%。  相似文献   

4.
语音质量是评价通信系统的一项重要指标。现有的语音质量感知评估算法采用基于Bark谱的感知模型,其算法复杂度较大,并且对于人耳的频率选择性的模拟存在不足。针对这一问题,本文提出一种新的客观语音质量评估方法,采用更加符合人耳听觉特性的Gammatone滤波器组提取特征参数,计算原始语音与失真语音的平均失真距离,并由主观平均意见分值和归一化平均失真距离之间的映射关系求出客观平均意见分值。实验表明,与感知评估方法相比,本文所提出算法的计算复杂度大大降低,同时保持了客观平均意见分值与主观平均意见分值之间的高相关度。  相似文献   

5.
功能性副语音如笑声、哭声、叹息声等的研究在情感识别领域中越来越受到关注,开始被作为识别说话人情感重要的信息之一.然而在应用与研究中功能性副语音能否被自动检出是前提.针对这一需求,根据音频分割算法提出了基于定长分段的功能性副语音自动检测算法以及基于距离与贝叶斯的功能性副语音自动检测算法.并提出了结合静音帧语音分割点确认算法对分割点进一步确认,而且通过实验验证了该算法是有效的.通过实验对比两种检测算法的优劣,实验结果表明:基于定长分段自动检测算法较好,检测率达到70%,较基于距离与贝叶斯的检测算法高出5%.  相似文献   

6.
基于听觉模型的特性,仿照MFCC参数提取过程,提出了一种基于Gammatone滤波器组的说话人语音特征提取方法。该方法用Gammatone滤波器组代替三角滤波器组求得倒谱系数,并且可以调整Gammatone滤波器组的通道数和带宽。将该方法所求得的特征在高斯混合模型识别系统中进行仿真实验,实验结果表明,该特征在一定情况下优于MFCC特征在系统的识别率,同时在Gammatone滤波器组通道数较高或滤波器带宽较小的情况下,系统具有较高的识别率。  相似文献   

7.
鼻漏气是腭咽闭合不全患者的典型症状,针对腭裂语音鼻漏气的特征进行研究,利用基于非线性动力学方法的递归图对特征进行发掘,并结合递归趋势分析法和基于递归图的区域进行分布处理,提取递归图分析的量化参数和最小区域矩阵作为特征参数。结合分类器,实现对腭裂语音鼻漏气的自动识别。实验针对降采样点、延迟时间、临界距离、语音单元、分类器种类等因素,进行了识别效果的分析,并综合权衡各因素对识别正确率的影响,选取了最优取值。实验结果表明,采用KNN分类器并当降采样点为30000点、延迟时间为3 ms、临界距离5个单位、语音单元为4帧时,腭裂语音鼻漏气自动识别的正确率达84.63%。腭裂语音鼻漏气自动识别算法能为临床腭咽功能评估提供高效、客观的辅助诊断依据。  相似文献   

8.
针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性相位耦合,抑制非高斯信号中的高斯噪声的特性,采用可以模拟人工耳蜗模型的Gammatone滤波器组,通过滤波处理将输入的语音信号分为32个听觉子频带,用三阶统计量对每个子频带的语音信号进行双谱估计并提取单一特征值来计算语音的可懂度。实例验证结果表明,该方法对信号失真变化敏感,其评价结果与主观评价具有很高的相关度,相对于传统的语音可懂度评价算法具有更好的评价效果。  相似文献   

9.
10.
一种新的语音数据压缩算法   总被引:2,自引:0,他引:2  
提出了一种基于B样条曲线拟合的语音压缩算法,为语音数据的压缩提供了新的思路。在PCM语音文件中,采用分段直线的方法对语音样本数据进行拟合,其处理结果与ADPCM的处理结果相近,如果采用高次的B样条曲线来拟合语音数据,在压缩率略有下降的情况下,话音质量将明显提高。算法具有实现简单、效率高的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号