排序方式: 共有28条查询结果,搜索用时 15 毫秒
1.
2.
3.
单通道语音信号在信噪比较大的环境下经过增强后再识别,能表现出较高的识别率。但是在低信噪比环境下,增强后语音信号的识别率急剧下降。针对此种情况,提出了一种用在识别系统前端的语音增强算法,该增强算法将采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改进的维纳滤波去除噪声残留并提升语音可懂度,最后用梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔科夫模型(Hidden Markov Model,HMM)对增强后的语音信号做特征提取并识别。实验分析结果表明,该方法能有效地抑制背景噪声并减少噪声残留,显著提升低信噪比环境下语音识别的准确性。 相似文献
4.
5.
鉴于干涉相位展开是InSAR技术应用中最为关键的步骤和难点,把扩展粒子滤波算法与修正矩阵束模型、量化跟踪策略结合起来,提出一种高效的扩展粒子滤波相位展开方法。利用修正矩阵束模型算法快速、准确地从复干涉图中获取扩展粒子滤波相位系统模型所需要的相位梯度信息,以改善算法效率;利用量化跟踪策略来指导相位展开路径,减小在搜索最佳待展开像元时所消耗的时间,进一步提高算法效率;最后,利用扩展粒子滤波算法沿量化跟踪策略所定义的路径处理缠绕像元,在滤去残留噪声同时完成相位展开。实验处理结果表明,该方法具有效率较高,稳健性较强的特点。 相似文献
6.
为了进一步提升服务机器人的自动化语音交互服务质量,提出一种改进的DFSMN-CTC模型,以提升语音交互系统的识别能力。其中,对传统的DFSMN模型中记忆模块的结构以及记忆单元之间的连接方式进行改进,然后将改进得到的模型与CTC进行结合,以实现日语语音的识别。实验结果表明,与其他建模准则构建的语音识别模型以及改进前的DFSMN模型相比,改进的DFSMN-CTC模型能够取得效果更好的语音交互效果,词错误率分别降低了6.42%和6.17%;与其他语音识别模型相比,改进的DFSMN-CTC模型在各种实验条件下均能保持最低的平均字错误率,语音识别精度较高。综上,使用改进的DFSMN-CTC模型所构建的日语语音交互系统能够实现效果良好的日语语音交互,实现更好的日语语音交互服务,具有一定的实际使用价值。 相似文献
7.
8.
9.
针对传统的无味卡尔曼相位展开算法效率和精度之间存在矛盾的问题,提出一种快速局部频率估计算法与量化质量图跟踪策略相结合的无味卡尔曼滤波(UKF)高效算法。快速局部频率估计算法首先利用二维傅里叶变换粗略计算出局部窗口内的复相位频谱的谱峰位置;然后,以谱峰为中心利用二维离散时间傅里叶变换快速算法计算出谱峰的精确位置,进而精确地获取局部频率值,得到UKF 相位展开系统模型所需的相位梯度估计值;最后,将UKF 算法与量化质量图跟踪策略相结合,利用量化质量图引导UKF 相位展开,进一步提高展开的效率。仿真实验验证了方法的有效性。 相似文献
10.
针对多基线InSAR高程重建算法鲁棒性差的问题,提出一种基于边缘检测与路径跟踪策略的多基线InSAR高程反演算法。该算法分为2个步骤。第1步是直接利用多基线最大似然估计算法从多幅不同基线的干涉相位图中获取粗略的地形高程,再用Sobel算子对滤波后的粗略地形高程进行边缘检测,获得地形的不连续边界;第2步则先构建优化的多基线InSAR高程反演模型,随后利用单通道InSAR相位解缠技术中的路径跟踪策略,引导构建的多基线InSAR高程反演模型沿高质量像元到低质量像元的路径进行高程重建,在连续区域引入邻域约束,在不连续区域则阻断邻域约束,既有利于提高算法在连续区域的抗噪性,又可避免邻域约束在不连续区域引起的误差传递现象,从而达到增强算法鲁棒性的目标。多组不同地形的高程反演结果证明了该方法的有效性。 相似文献