期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑展恒曾庆宁张少兵《桂林电子科技大学学报》2008,28(1):23-26

端点检测是从一段语音中检测出语音段和噪声段,是语音信号处理过程中的一个重要环节.为了提高在低信噪比下的检测效果,提出了一种基于子带能量的检测算法,该算法主要计算子带能量等参数,并通过更新噪声能量来实现.实验结果表明:与常规的端点检测方法相比,该方法具有良好的检测能力,并且在低信噪比环境下较好的端点检测能力. 相似文献

2.

一种基于频域特征和过渡段判决的端点检测算法

郭逾张二华刘驰《山东大学学报(工学版)》2016,46(2):57-63

为了提高语音端点检测的准确性,增强端点检测算法在噪声环境下的鲁棒性,提出两种新的端点检测参数。其中,基于临界频带的谱熵参数综合考虑了人耳对语音的感知特性以及语音信号和噪声信号的频域分布差异,差值频域能量参数考虑了语音帧和无声帧在频域上的能量差异。结合两种参数的优点,构成一种鲁棒的端点检测参数,同时,为了避免因阀值判决的单一性而产生误判,在端点检测过程中加入了基于特征分布统计的过渡段判决。试验结果表明,本研究提出的语音端点检测算法对语音帧和无声帧具有较好的区分性,在不同噪声且信噪比较低情况下,端点检测准确率相比传统抗噪端点检测算法均有所提升,特别是在非平稳噪声下,准确率提升超过5%。相似文献

3.

基于谱熵的语音端点检测算法改进研究 总被引：1，自引：0，他引：1

李荣荣胡昌奎余娟《武汉理工大学学报》2013,35(7):134-139

语音端点检测是语音处理中重要的领域之一。常规谱熵语音端点检测算法是通过检测语音的功率谱的平坦程度,从而达到语音端点检测的目的。但是该方法在平稳噪声环境下较好,在无噪声和非平稳噪声环境下效果较差。作者在分析了无噪声环境下常规谱熵端点检测算法效果差的原因的基础上,结合了语音的短时能量算法,对常规谱熵算法进行了改进,形成了一个新的特征参数——谱熵能量积。仿真结果显示,该方法相对于常规谱熵算法,在无噪声的环境下检测精度有了很大的提高,在非平稳噪声环境下也有了一定的提高,鲁棒性得到增强。相似文献

4.

一种基于分带谱熵和谱能量的语音端点检测算法 总被引：3，自引：0，他引：3

李如玮鲍长春《北京工业大学学报》2007,33(9):920-924

语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用的端点检测算法,并结合分带谱熵和谱能量形成了一个新的特征参数集,利用该参数集进行端点检测,弥补了分别采用分带谱熵和谱能量进行端点检测的缺陷,提高了检测性能. 相似文献

5.

基于时频增强和谱熵的语音端点检测技术 总被引：2，自引：0，他引：2

武传艳范影乐《杭州电子科技大学学报》2005,25(1):18-21

该文提出了基于时频增强和谱熵的语音端点检测算法。该算法对带噪语音在频域利用谱减法去除宽带加性噪声，在时域去除由谱减带来的残差噪声从而对语音进行了增强。对增强后的语音利用谱熵特征进行端点检测。实验结果表明，该算法快速有效，具有较强的抗噪能力，特别适合低信噪比的语音端点检测。相似文献

6.

融合Burg谱估计与信号变化率测度的语音端点检测

张君昌胡海涛崔力《西安电子科技大学学报(自然科学版)》2014,41(3):192-195+220

针对现有基于特征的语音端点检测方法在低信噪比及非平稳噪声下检测性能较低的问题,提出了一种融合Burg谱估计与长时段信号变化率测度(LTSV)的语音端点检测方法．该方法采用表征较长时段语音变化率的LTSV参数,较准确地反映了语音的非平稳程度．与传统基于特征的语音端点检测方法相比,该方法在低信噪比及非平稳噪声情况下的检测性能有了较大提高．并融合Burg谱估计,与传统Welch谱估计方法相比,提高了LTSV参数的区分度,从而进一步提高了检测的准确率．仿真结果表明:采用融合Burg谱估计与LTSV的语音端点检测方法在低信噪比(-10dB)及非平稳噪声情况下,与传统基于特征的语音端点检测方法相比,检测准确率普遍提高了约6%以上,说明该方法在低信噪比及非平稳噪声环境下鲁棒性更好．相似文献

7.

基于小波分析的语音端点检测算法研究与仿真 总被引：6，自引：2，他引：4

陈宝远梁伟明《哈尔滨理工大学学报》2009,14(1):51-54

以小波变换及多分辨分析为理论基础,对语音端点检测中小波系数方差算法和子带平均能量算法进行了分析和研究,利用语音和噪声的频域差别,对这两种算法进行了优化,并应用于端点检测系统中,有效地改善了小波系数方差算法耗时长、实时性差的缺点,并克服了子带平均能量算法只对高斯白噪声检测效果好的局限性。提高了语音端点检测系统的实用性．通过MATLAB软件仿真的实验结果表明,采用优化算法的系统实现了语音端点检测准确性和快速性的最佳匹配,达到了此类检测设备的实用要求．相似文献

8.

基于谱熵梅尔积的语音端点检测方法

吴新忠夏令祥张旭周成《北京邮电大学学报》2019,42(2):83-89

为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积（MFPH）的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC₀,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则（BIC）算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高. 相似文献

9.

强噪声背景下汉语语音端点检测和音节分割 总被引：3，自引：0，他引：3

杨崇林李雪耀《哈尔滨工程大学学报》1997,18(5):28-32

根据汉语语音的特点，提出了强噪声背景下对汉语语音进行了端点检测和音节分割的新算法，在８５ｄＢ的噪声环境中，实验考察了端点检测的正确性和音节分割的稳定性，结果表明，算法在这两方面达到了很高的性能，且与发音者无关。相似文献

10.

基于Mel频率倒谱参数相似度的语音端点检测算法

王宏志徐玉超李美静《吉林大学学报(工学版)》2012,42(5):1331-1335

为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。相似文献

11.

基于改进双门限法的语音端点检测研究

孙一鸣吴杨扬李平《长春理工大学学报(自然科学版)》2016,(1):92-95

语音信号的端点检测是语音识别过程中的重要环节,端点检测结果精确与否直接关系着语音识别的准确度。使用车载语音作为测试数据,利用传统双门限法进行端点检测,发现传统双门限方法在静音条件下和带噪条件下获得语音端点检测信息存在较大误差。针对上述问题,提出了一种改进的双门限法进行语音端点检测,针对语音信号以及短时平均能量和过零率进行处理,并通过Matlab进行仿真,实验结果说明提出的改进方法与传统方法相比,在静音和带噪条件下,都更接近测试数据中真正的语音端点。相似文献

12.

一个适用于孤立单词语音识别系统的数据压缩方法—WHT算法

赵鹤芹《云南工业大学学报》1990,(3)

本文介绍一个适用于孤立单词语音识别系统的数据压缩方法——二维沃尔什变换算法(WHT算法)。这种方法的主要优点是运算简单,节省内存单元,从而可以提高话音识别的速度和精度。相似文献

13.

车载自动语音识别系统设计 总被引：1，自引：0，他引：1

张戟杨腾飞《佳木斯工学院学报》2011,(2):201-205

随着车载电子设备的蓬勃发展,驾驶过程中操作设备的危险性也日益提高,如何在驾驶过程中安全地使用设备也逐渐被提上议事日程.本文开发的车载自动语音识别系统可以很好地解决这一问题.本文采用单片机STC10L08XE和OMAP3530为核心处理器,语音识别专用芯片LD3320为语音识别模块,设计了一套车载自动语音识别系统,并对软件系统的设计进行了阐述.该系统为非特定人语音识别,结构简单,识别准确率高达95%,性价比高,且识别列表的关键词可以动态编辑,与别的语音识别系统相比有明显优势,便于大力推广和应用. 相似文献

14.

基于DTW 和EMD的孤立词语音识别研究

徐必伟苏成利杨微曹江涛《辽宁石油化工大学学报》2018,38(1):74-78

针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。相似文献

15.

噪声环境下智能机器人语音控制特征提取方法

谢怡宁黄金杰何勇军《北京邮电大学学报》2013,36(3):83-87

针对机器人的应用场合通常存在各种噪声干扰的问题,提出了一种基于稀疏编码的语音特征提取方法.利用稀疏编码能稀疏表示语音的特性,在梅尔频域对语音增强后提取特征,将稀疏去噪与语音特征提取相融合,实现了混噪语音的有效补偿.在预设场景中的实验结果表明,与现有特征提取方法相比,所提出的语音特征提取方法能有效降低噪声对语音特征的影响,提高机器人语音控制的性能. 相似文献

16.

不定人语音识别系统 总被引：1，自引：0，他引：1

胡春静吴善培《北京邮电大学学报》1995,18(1):25-30

采用了说话人自适应和大数量人的训练数据两种方法解决不定人语音识别问题,在离散隐马尔可夫模型ＤＨＭＭ孤立字语音识别系统中,采用了３种说话人自适应方法,方法１,方法２为码本自适应,方法３为新人数据自适应,并将新建的１０００人的语音库用于不定人语音识别。实验结果表明,说话人自适应方法均有一定的自适应效果,特别是多码本自适应后,识别率可提高１６％,达到９３％以上;在数据库的采用,使得不定人的数字识别率达到相似文献

17.

一种基于决策层融合的多模态情感识别方法

下载免费PDF全文

韩天翊林荣恒《南京师范大学学报》2022,(2):035-40

设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度. 相似文献

18.

不定人汉语数字音实时识别方法的研究

栗学丽《山东大学学报(工学版)》1997,(1)

提出用非线性规整的多门限过零率矢量及过零幅度差来识别０～９十个数字，通过加入自适应算法，提高了识别率．这种方法计算简单、快速，易于用单片机做成实时语音识别系统，具有实用价值相似文献

19.

湖南省主要内生成矿事件的构造格局控矿特征及动力机制

下载免费PDF全文

俞颖黄风华刘永芬《延边大学学报(自然科学版)》2020,(1):49-70

湖南省内生矿产资源丰富,内生成矿事件主要有加里东期(以志留纪为主)、印支晚期(晚三叠世)、燕山中晚期(晚侏罗世—早白垩世)等3期。以区域矿产资料为基础,结合大地构造、成岩成矿年龄、矿床成因机制等研究成果,对上述3期内生成矿事件的构造格局控矿特征和动力机制进行探讨。①受加里东运动自东南向西北扩展以及深部岩石圈结构差异控制,加里东期湖南省自东南往西北分为成矿特征有别的3个构造带。湘中—湘东南构造岩浆带(Ⅰ)发生后碰撞花岗质岩浆活动,于局部产生与岩浆活动相关的W、萤石等成矿作用; 雪峰构造带(Ⅱ)东部的雪峰冲断带(Ⅱ₁)形成了以构造活化成因为主的金矿和锑金矿; 雪峰构造带(Ⅱ)西部的武陵低缓褶皱带(Ⅱ₂)及湘西北构造抬升带(Ⅲ)内形成了与寒武纪同沉积断裂活动、加里东运动后的伸展活动以及相应的热液活动有关的汞铅锌矿。②印支晚期受深部岩石圈结构差异控制,湖南省自东南至西北分为3个构造带:湘中—湘东南构造岩浆带(Ⅰ)因后碰撞减压熔融而发生大规模花岗质岩浆活动,从而于其东南部形成钨锡铅锌多金属矿床,西北部形成锑金钨多金属矿床; 雪峰构造带(Ⅱ)可能无内生热液成矿作用; 湘西北褶皱带(Ⅲ)发育小型脉型铅锌矿。③燕山中晚期,湖南省自东南往西北分为3个构造带:湘中—湘东构造岩浆带(Ⅰ)受岩石圈拆沉、软流圈上隆、陆内碰撞后期增温减压、俯冲板块崩塌等深部构造作用控制而发生大规模花岗质岩浆活动,形成了大量的有色金属矿床和金矿床; 雪峰西部构造带(Ⅱ)成矿作用弱,局部存在Au、Hg成矿作用; 湘西北褶皱带(Ⅲ)发育少量低温热液充填型萤石矿和砷矿。相似文献