首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
韦国刚  周萍  杨青 《测控技术》2015,34(2):31-34
语音端点检测是语音识别系统非常重要的组成部分,一种理想的语音端点检测方法,在噪声环境中要具有较强的鲁棒性.为了提高检测方法在噪声环境中的鲁棒性,在短时能量的基础上,结合谱平度和幅度谱的主频率特征,分别进行判决,再采用投票决策机制确定端点检测结果,提出了一种比较理想的语音端点检测方法.实验结果表明,与传统的短时能量法和短时TEO能量法相比,该算法在各种加性噪声下具有良好的鲁棒性,在较低信噪比下仍能准确地区分有用信号和噪声,验证了该算法的有效性.  相似文献   

2.
为了解决低信噪比环境下传统的语音端点检测算法性能较差且不能自适应环境噪声,提出了一种基于时频参数融合的自适应语音端点检测算法。将对数能量与改进的Mel能量进行融合,获得了一种新的时频参数(TF),该参数能有效地区分语音段和噪声段。使用该参数在噪声段对阈值进行更新,采用门限检测法判定出语音端点。仿真实验表明,该算法具有较好的鲁棒性,且能够准确地检测出语音端点。当信噪比(SNR)为0 dB时,端点检测错误率仅为15%左右。  相似文献   

3.
语音端点检测是语音识别系统的重要环节之一。针对噪声环境下的语音端点检测困难,提出了一种改进的支持向量机的语音端点检测方法。利用小波分析(WA)提取含噪语音信号的特征向量。采用遗传算法(GA)得到最优的SVM核函数参数[γ]和惩罚因子[C]。建立语音端点检测模型。在Matlab软件平台下进行仿真实验,结果表明在不同的噪声条件下,GA-SVM算法的平均检测率达到94.5%,明显优于传统的双门限算法和普通的SVM算法。  相似文献   

4.
一种精确检测语音端点的方法   总被引:1,自引:0,他引:1  
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响,特别是对端点检测比较敏感的语音识别算法。本文引用窗长动态变化的端点检测技术,并将传统的双门限端点检测算法和窗长动态改变的端点检测技术结合起来用于语音端点检测。大量实验表明这种技术可以比较精确的检测语音端点,特别是地检测语音的起始端点中有很大的优势。使用改进后的语音端点检测技术,可以有效地提高语音识别率。  相似文献   

5.
一种语音端点检测方法的探究   总被引:16,自引:0,他引:16  
刘庆升  徐霄鹏  黄文浩 《计算机工程》2003,29(3):120-121,138
研究了一种以过零率ZCR和能量E为特征的语音端点检测方法。在进行大量实验的基础上,经过分析,对该方法提出了几点改进。  相似文献   

6.
提出了一种基于滑动窗口的综合语音端点检测方法。从提高系统鲁棒性角度出发,利用各种综合的算法思想方法提高端点检测的准确性,鲁棒性和提高语音识别系统的总体识别率。利用频域能量、回声消除、DTMF滤除、利用信噪比确定多种阈值用于判定、利用语音渡形特点进行粗调和精调等。试验表明该方法在语音端点检测的错误率和端点误差方面都显著减少了,系统鲁棒性得到明显提高。  相似文献   

7.
一种改进的检测语音端点的方法   总被引:8,自引:9,他引:8  
在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感,本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变的端点检测方法,并将两者有机的融合到传统的双门限端点检测算法中。试验表明这种算法可以比较精确的检测出语音端点,适合于对端点检测比较敏感的语音识别算法。使用改进后的语音端点检测方法,可以有效地提高语音识别率。  相似文献   

8.
本文在分析基于短时能量的语音端点检测算法局限的基础上,引入短时信噪比SNR估计方法,并设计自适应的判决门限,提出一种自适应语音端点检测算法.通过对平稳高斯白噪声环境下信噪比从-10dB到20dB的带噪语音信号进行的仿真实验表明,所提方法能更为准确地检测到语音的端点.  相似文献   

9.
为提高复杂噪声环境下语音信号端点检测的准确率,提出一种基于梅尔频谱倒谱系数(MFCC)距离的多维特征语音信号端点检测算法。通过计算语音信号的MFCC距离,结合短时能量和短时过零率对特征距离进行修正,并更新其阈值,建立自适应噪声模型,实现复杂噪声中语音信号端点的准确检测。实验结果表明,与基于双门限能量和基于倒谱距离的2种经典检测算法相比,在计算效率相同的条件下,该算法的检测准确率更高。  相似文献   

10.
一种基于自适应谱熵的端点检测改进方法   总被引:5,自引:0,他引:5  
在低信噪比的环境下,为增强与噪声的区分度,提出了一种适应于低信噪比环境的语音端点检测方法.通过改进语音端点检测的特征参数,更好地区分语音信号与噪声信号,提高在低信噪比环境下的端点检测正确率.基于子带谱熵,引入正值常量对基本谱熵参数进行算法改进,得到改良的负谱熵特征,并结合自适应子带选择方法,得到一种新颖的特征参数--自适应子带常量负谱熵.特征在低信噪比的情况下有较强的抗噪能力,并能够准确地检测出语音端点.实验结果表明,不仅快速有效,具有较强的鲁棒性,而且适合低信噪比的语音端点检测.  相似文献   

11.
针对复杂背景下小目标特征经多次卷积被背景噪声淹没导致的检测精度低的问题,提出一种增强弱特征表达的一阶段轻量级小目标检测算法SA-YOLO.首先,用改进的ShuffleNetv2网络构建骨干网络,通过嵌入SE注意力模块和Inception结构,提升网络在复杂背景下的特征提取能力,有效地抑制背景噪声,充分提取弱特征;其次,在颈部网络,采用新的特征融合模块,以含有弱特征较多的低层级特征块的空间位置信息对高层级特征进行权重调整,提高不同层级的特征融合利用率,减少小目标的特征损失;最后,在头部网络,用解耦的检测头替换原YOLO耦合的检测头,解耦分类任务和回归任务,提高弱特征的解码能力,增强小目标检测的性能.在公开数据集COCO2017上进行实验,结果表明,SA-YOLO参数量仅有1.14M,小目标平均检测召回率$rm AR_S$达到31.6%.同时,将所提出算法与近几年主流算法进行对比,结果表明,所提出算法在小目标检测方面具有较强的竞争力.  相似文献   

12.
将基于深度学习的图像分类方法用于辅助病理学诊断优势突出,但获取病理学切片过程中产生的噪声会影响网络的泛化性能,进而降低分类算法的准确率.针对该问题,提出了一种鲁棒的病理学图像分类算法——多尺度小波池化协方差(multi-scale wavelet pooling covariance,MWPC)网络.MWPC网络主要由小波池化层、复合卷积层、多尺度特征融合和协方差特征提取层4个核心模块构成,其中小波池化层在抑制噪声影响的同时,保护了有效特征不受损失.多尺度特征融合将浅层特征与深层特征结合,使深层特征能够保留更多图像细节.协方差特征提取层可以获取图像的高阶统计特征,提高网络的泛化性能.在病理图像数据集上的测试结果表明,MWPC网络针对组织病理学图像分块级别的五分类任务,在无噪声条件下准确率可以达到90.90%,比ResNet提高1.68%,比Inception-v3分类网络提高0.43%;在模拟椒盐噪声、高斯噪声和柯西噪声等条件下,其噪声鲁棒性能提升明显,且能够降低平均噪声误差.多种网络模块的消融实验结果表明,MWPC网络能够提高网络分类性能和噪声鲁棒性.  相似文献   

13.
改进的自适应中值滤波算法   总被引:4,自引:0,他引:4  
中值滤波窗口大小影响滤波器性能,3×3滤波窗口可以很好地保持图像细节。提出一种新的自适应中值滤波方法。将3×3窗口中心的极值点作为候选噪声点,若候选噪声点仍然是7×7窗口的极值点,则该点即是噪声点。若以噪声点为中心的3×3滤波窗口的中值不是噪声,则噪声用中值替换。重复以上过程,直到没有噪声点被替换。如果图像中仍然存在大的噪声团块,则噪声用相邻的三个信号点的灰度均值替换。实验结果表明,该方法能够有效去除脉冲噪声,并在抑制噪声的同时很好地保护图像的细节。  相似文献   

14.
婴儿面部表情智能化识别, 可辅助看护人员更好地关注婴儿的身心健康. 由于婴儿面部线条流畅且五官锐感偏弱导致面部表情类间相似性高于成人, 为了解决类间相似性高的问题, 提出多尺度信息融合网络. 该网络整体分为2个阶段: 在第1阶段使用融合模块在空间域与通道域双重维度下融合局部特征与全局特征, 增强特征的表达能力; 在第2阶段采用自适应深度中心损失, 利用注意力机制估计融合特征的权重用以指导中心损失, 促进婴儿表情特征的类内紧凑和类间分离. 实验结果表明, 多尺度信息融合网络在婴儿面部表情数据集中识别准确率达到95.46%, 在AUC、召回率和F1得分3个评价指标上分别达到99.07%、95.88%和95.89%, 与现有面部表情识别网络相比, 识别效果最优. 将多尺度信息融合网络在公开面部表情数据集上进行泛化性实验, 准确率达到89.87%.  相似文献   

15.
《图学学报》2025,46(1)
通过对数据扩增方式合成的缺陷数据进行质量评估;有助于实现缺陷数据高质量扩充;进而缓解缺陷数据不足导致的检测模型性能不佳问题。针对现有质量评价算法在评估合成缺陷数据质量时更关注数据的失真特性而忽略了对数据缺陷属性考量的问题;提出一种基于注意力特征增强(AFE)和多尺度注意力质量感知(MAQP)的模型SDENet;综合考虑数据的失真特性和缺陷属性进行质量评价。首先;AFE通过双分支池化操作提高模型对不同尺寸、位置缺陷的泛化能力;并结合注意力机制增强模型对特征的表达。其次;MAQP对AFE增强后的特征进行向量化与融合处理;以更好地感知合成缺陷数据质量。最后;对融合后的特征进行质量评估;得到最终的评估分数。在构建的合成道路裂缝缺陷数据集上进行实验;结果表明;SDENet模型在RMSE;RMAE;PLCC和SROCC指标上均取得最优结果;比次优模型依次提升10.7%;5.0%;1.8%和1.8%;验证了模型的有效性。在失真数据集TID2013上;SDENet模型也取得较有竞争的结果;在PLCC和SROCC指标上依次达到0.902和0.876。  相似文献   

16.
目的 螺栓销钉是输电线路中至关重要的连接部件,螺栓的销钉缺失会导致输电线路中关键部件解体,甚至造成大规模停电事故。螺栓缺销检测属于小目标检测问题,由于其尺寸较小且背景复杂,现有的目标检测算法针对螺栓缺销的检测效果较差。为了提升输电线路中螺栓缺销的检测效果,本文以SSD(single shot multibox detector)算法为基础,提出了基于隔级交叉自适应特征融合的输电线路螺栓缺销检测方法。方法 在建立了螺栓缺销故障检测数据集后,首先在SSD网络中加入隔级交叉特征金字塔结构,增强特征图的视觉信息和语义信息;其次,引入自适应特征融合机制进行特征图二次融合,不同尺度的特征图以自适应学习到的权重进行加权特征融合,有效提升螺栓缺销的检测效果;最后,对原始的SSD网络中的先验框尺寸进行调整,使其大小和长宽比更加适合螺栓目标。结果 实验结果表明,本文方法在正常螺栓类的检测精度达到87.93%,螺栓缺销类的检测精度达到89.15%。与原始的SSD网络相比,检测精度分别提升了2.71%和3.99%。结论 本文方法针对螺栓缺销故障的检测精度较高,较原始SSD网络的检测精度有明显提升,与其他方法相...  相似文献   

17.
在小波变换的基础上提出了自适应图像融合算法,该方法通过自适应多尺寸窗的应用得到融合图像.最后分别对仿真图像和多聚焦图像进行了图像融合的实验并与其它几种算法进行了比较.结果表明,该算法对提高图像融合的质量有显著的优势,证明了算法的有效性和可行性.  相似文献   

18.
改进CamShift算法的眼动跟踪方法   总被引:1,自引:0,他引:1  
针对CamShift跟踪算法仅采用颜色特征,在存在颜色相近干扰目标、头部快速运动或者虹膜发生形变等情况易发生眼动跟踪不准确或失败等问题,提出一种基于改进CamShift算法的眼动跟踪方法。在CamShift算法中,计算边缘直方图分布,在颜色特征基础上融合边缘特征,同时通过分析饱和度分量抑制噪声影响,并利用基于边缘特征的自定义方法判断虹膜是否发生形变。当发生形变时,自动更新模板,根据历史运动轨迹预测虹膜中心。实验表明,该方法能有效改善眼动跟踪性能,且定位虹膜精确、错误率低、速度快,预测虹膜中心与实际虹膜中心相差极小,达到了准确性、鲁棒性和实时性的要求。  相似文献   

19.
论述了基于LMS算法的自适应噪声抵消器和自适应谱线增强器的工作原理及改进的算法,并将自适应噪声抵消器和自适应谱线增强器合并为一个滤波器应用于电参数测量系统中,仿真实验证明这种滤波器去除噪声的性能较佳.  相似文献   

20.
传统文献特征提取方法通常依赖于单一维度的领域特征, 难以准确预测细化的文献研究领域关联程度. 细化的关联程度预测要求提取极高精度的领域关联特征, 但在多维度提取过程中很容易出现过平滑问题, 进而导致错误的领域关联程度预测, 使得量化精度较低. 为解决上述问题, 本文提出了一种基于多维特征融合的文献研究领域关联程度量化方法. 首先, 在传统Doc2Vec模型提取文献语义内容特征的基础上, 构建多个关联维度图并赋予相应权重, 以提高结构关联特征的全面性. 其次, 在图学习模块中引入多通道传播策略和自适应聚合机制, 通过优化节点关联特征的聚合方式, 缓解了传统GCN的过平滑问题, 从而实现不同文献间精确的研究领域关联. 最后, 通过构建覆盖学者多维关联特征向量空间的最小n维球模型, 定量评估跨领域学者科研能力. 在大规模真实文献数据集上的实验结果表明, 该方法的带误差容限准确率(tolerance-aware accuracy, TAA)达到0.68, 比Doc2Vec、GCN和Sentence-BERT模型分别高出0.67、0.08和0.02, 且在不同的图神经网络模型中性能波动较小, 证明了所提方法在精度和稳定性方面均优于近年主流的基线模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号