首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 895 毫秒
1.
带噪汉语语音识别的端点检测方法   总被引:4,自引:0,他引:4  
王朋  塔维娜  陈树中 《计算机工程》2003,29(17):120-121,135
在语音识别系统中产生错误识别的原因之一是端点检测有误差,在高信噪比情况下,正确地确定语音的端点并不困难,然而,大多数实际的语音识别系统需工作在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法在噪声环境下不能有效地工作。该文利用改进的隐马尔柯夫模型(HMM)进行语音检测以适应噪声的变化,实验结果表明本方法可得到高正确率的带噪语音端点检测。  相似文献   

2.
端点检测是语音识别系统的一个重要组成,尤其是在噪声环境中,其准确性对语音识别系统性能有直接影响。提出了一种基于小波子带倒谱系数(SBC)的语音信号端点检测方法,利用小波变换对频带进行尺度划分,采用小波子带倒谱能量检测语音端点。通过与MFCC的仿真对比以及大量实验分析,小波子带倒谱特征在语音端点检测中具有更好的识别性能。  相似文献   

3.
为了进行有效的语音信号处理,并降低语音信号的冗余度,通常采用端点检测技术来提取语音信号中的有效部分。本文在传统语音端点检测方法的基础上,提出了一种基于基音周期对语音段末尾进行判别的方法,针对汉语发音都是以浊音结尾的特点,同时利用基音周期对浊音段信号比较敏感这一特性,能够有效地避开汉语语音信号尾部拖音段中所包含的无效信息,既提高了端点检测的准确性,又减少了后续语音识别系统样本训练时间。实验结果证明,该方法对于汉语中孤立词末尾的拖音段,可以得到较好的端点检测效果。  相似文献   

4.
语音端点检测是语音识别系统的一个重要组成部分,特别是在噪声环境下,其准确性直接影响到语音识别系统的计算复杂度和识别性能。提出了一种在噪声环境下基于短时TEO能量的语音信号端点检测方法,采用了双门限-三态转换判决机制以保证算法在噪声环境下的端点检测准确性和对信号绝对幅度变化的稳健性。实验结果表明,与传统的短时能量法和谱熵法相比,该算法在低信噪比情况下具有更好的端点检测能力,显示了算法的优越性。  相似文献   

5.
一种语音信号端点检测方法的研究   总被引:3,自引:0,他引:3  
在语音识别系统中,端点检测的误差会降低系统的识别率,进行有效准确的端点检测是语音识别的重要步骤。因此端点检测逐渐成为语音信号处理中的一个热点。本文提出了一种基于模型的Teager能量端点检测方法。实验证明,该算法比传统的能量过零率端点检测算法具有更高的识别率,能够更准确的检测出语音信号的端点。  相似文献   

6.
一种改进的检测语音端点的方法   总被引:8,自引:9,他引:8  
在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感,本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变的端点检测方法,并将两者有机的融合到传统的双门限端点检测算法中。试验表明这种算法可以比较精确的检测出语音端点,适合于对端点检测比较敏感的语音识别算法。使用改进后的语音端点检测方法,可以有效地提高语音识别率。  相似文献   

7.
语音端点检测是语音识别系统的重要环节之一。针对噪声环境下的语音端点检测困难,提出了一种改进的支持向量机的语音端点检测方法。利用小波分析(WA)提取含噪语音信号的特征向量。采用遗传算法(GA)得到最优的SVM核函数参数[γ]和惩罚因子[C]。建立语音端点检测模型。在Matlab软件平台下进行仿真实验,结果表明在不同的噪声条件下,GA-SVM算法的平均检测率达到94.5%,明显优于传统的双门限算法和普通的SVM算法。  相似文献   

8.
在嵌入式平台下的语音识别系统中,端点检测是非常重要的,语音起始点的位置直接影响识别率。然而在复杂环境下,语音的输入波形千差万别,端点检测的精确性很难保证。本文研究了一种基于零能积的区域概率统计法,通过训练得到语音零能积的概念分布,并结合一阶线性差分及谱减法进行端点检测。进一步提高了信噪比,解决了复杂环境下端点检测精确度低的问题。  相似文献   

9.
在语音识别系统中,端点检测技术对于系统的识别准确率来说是至关重要的。提出一基于小波子带能量和小波系数方差的语音端点检测算法。和其他传统的端点检测方法如短时能量、过零率方法等相比,该算法更加有效。计算机仿真结果证明了该算法更适合于语音端点检测,尤其是在低信噪比(SNR)条件下。  相似文献   

10.
提出了一种基于滑动窗口的综合语音端点检测方法。从提高系统鲁棒性角度出发,利用各种综合的算法思想方法提高端点检测的准确性,鲁棒性和提高语音识别系统的总体识别率。利用频域能量、回声消除、DTMF滤除、利用信噪比确定多种阈值用于判定、利用语音渡形特点进行粗调和精调等。试验表明该方法在语音端点检测的错误率和端点误差方面都显著减少了,系统鲁棒性得到明显提高。  相似文献   

11.
一种噪声环境下连续语音识别的快速端点检测算法   总被引:2,自引:0,他引:2  
根据汉语语音的特点,该算法利用幅度及功率谱对语音端点进行检测,有效地消除了背景噪声及DC分量的干扰。算法采用实际语音采样进行分析,试验结果表明此算法不仅能有效地标识出语音的起始及终止点,并且还具有相当高的运算效率。  相似文献   

12.
基于灰度特征约束的HT融合策略识别机场目标   总被引:1,自引:1,他引:0  
针对跑道信息在机场目标识别算法中的重要性,分析了巡航子母弹在实施跑道封锁时对跑道端点信息的需求,给出了机场红外图像的灰度约束先验知识,针对传统霍夫变换无法获取直线端点信息的特点,提出了一种新的基于灰度特征约束的HT附加策略识别算法,对低对比度的红外图像进行了识别,仿真计算结果表明,可以较为有效地获得准确的跑道中点和端点信息。  相似文献   

13.
提出了基于互相关函数的检测元音的端点检测算法。在语音识别系统中产生错误识别的原因之一是端点检测有误差,在高信噪比情况下,准确地确定语音的端点并不困难,然而在低信噪比情况下,一些常规的端点检测方法,例如基于能量的端点检测方法就不能有效地工作。本文利用互相关函数检测元音的端点,然后根据元音和辅音的能量比一般相对稳定的特点确定出实际语音端点。实验结果表明,本方法可以在不同信噪比下提高端点检测的准确率。  相似文献   

14.
杨海燕  吴雷  周萍 《测控技术》2019,38(5):88-93
在连续语音识别系统中,针对强噪声环境下传统双门限语音检测方法出现的误检问题,提出了一种结合压缩感知理论和MFCC倒谱系数的端点检测算法。该算法采用Hadamard随机观测矩阵和改进的OMP重构算法对语音信号进行压缩感知与重构,利用语音信号在离散余弦基上的近似稀疏性,提取重构信号的MFCC倒谱系数来检测语音信号的端点。仿真结果表明,提出的改进算法具有较强的鲁棒性,能满足在强噪声环境下对连续语音信号进行有效端点检测的要求。  相似文献   

15.
基于android系统的图像内容检测   总被引:1,自引:1,他引:1  
鄢志勇  王嘉梅 《软件》2012,(6):35-37
本文提出一中基于android系统的人脸检测方法,可以针对不同分辨率下的多个人脸进行检测,并针对多检测目标环境提出了修正算法,结果证明能提高多人脸检测条件下的识别正确率。利用SQLite创建基于图像内容的特征数据库,以特征检索的方式对图像进行分类。同时介绍了基于Windows系统的Android开发环境搭建和算法实现的关键步骤。  相似文献   

16.
传感器与摄像头等设备的传统动作识别存在受环境影响大及侵犯用户隐私等问题,以京剧动作为研究对象,提出一种非接触式人员动作识别方法Wi-Opera。在离线阶段采集Wi-Fi路由设备上人体动作的信道状态信息(CSI)数据,利用巴特沃斯低通滤波器和小波变换方法对CSI数据分别进行去噪和平滑处理,通过主成分分析算法提取动作的特征值构建每个京剧动作的决策树,最终形成随机森林模型。在在线阶段实时采集的动作数据经过处理后,将京剧动作的特征值输入随机森林模型中进行识别,从而输出识别结果。实验结果表明,Wi-Opera方法的综合识别精度为94.6%,具有较高的识别精度和较强的鲁棒性。  相似文献   

17.
In this paper, we propose a Gabor-based face recognition method. This method fuses multi-resolution Gabor features of face images at the matching score level. The first implementation scheme of this method directly takes the sum of the matching scores of multi-resolution Gabor features of face images as the final matching score. The second implementation scheme first codes the phase of the Gabor feature and then uses a weighted matching score level fusion algorithm to fuse the magnitude and phase of the Gabor feature. A number of experimental results show that the proposed method has a good performance and outperforms conventional Gabor-based face recognition methods that equally treat all the Gabor features and directly fuse them at the feature level. The experimental result also illustrates that in face recognition, the low-resolution representation of the phase of the Gabor feature such as the code of the phase is more discriminative than the phase itself. The codes of our method will be available at http://www.yongxu.org/lunwen.html.  相似文献   

18.
瞬时频率的Prony方法提取及MATLAB实现   总被引:1,自引:1,他引:0  
王磊  郝士琦  戎雁 《计算机仿真》2008,25(2):303-305,309
瞬时频率是信号重要的瞬时特征参数,由于其在通信中的信号调制样式识别、电台"指纹"识别等诸多方面有着广泛的应用,故成为信号处理领域的一个研究热点.旨在有效的提取信号的瞬时频率,介绍了瞬时频率的定义、常用的瞬时频率提取方法及扩展的Prony方法的基本原理与步骤,采用Prony方法提取信号的瞬时频率,给出了算法流程和MATLAB实现的核心程序代码,对线性扫频信号和4FSK信号进行了仿真试验,与相位建模法、WVD法相比,估计的瞬时频率在低信噪比时的均方差较小,结果表明该方法可行,在低信噪比条件下有一定的优势.  相似文献   

19.
基于排列组合熵的语音端点检测技术研究   总被引:1,自引:1,他引:0  
语音端点检测对于后续语音识别分析有着重要的意义,论文研究基于排列组合熵的语音端点检测技术。分析排列数和窗长对检测性能的影响,对含不同噪声类型及不同信噪比的中英文语音样本进行了端点检测实验。尤其在低信噪比情形下,检测方法要优于谱熵特征检测方法。该方法具有较优的稳健性和实时性等特点,为强背景噪声下的语音端点检测提供了新的研究途径。  相似文献   

20.
针对现有婴儿哭声识别方法在噪声环境下和不同婴儿间鲁棒性不足的问题,提出一种婴儿哭声识别的优化算法。利用子带谱熵法端点确定婴儿哭声信号的有效区间,增强算法在噪声环境下的鲁棒性;从有效哭声信号中提取平滑Mel频率倒谱系数 (SMFCC)作为特征参数;基于SMFCC构建婴儿哭声模板,增强算法在不同婴儿间的鲁棒性;使用动态时间规整算法(DTW)计算哭声信号与模板的距离,得到识别结果。实验表明:在具有噪声的婴儿哭声测试集中,哭声识别准确率均达到72%以上,该方案在噪声环境下和不同婴儿个体的哭声识别中表现出较强的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号