首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
提出了一种二级搜索模型,该模型首先利用最小音节步长搜索算法进行语音段检测,然后采用二分搜索算法确定语音段的精确位置。理论分析及实际运行结果表明,与传统的基于能量的端点检测算法相比,其搜索效率能够提高70%以上。该算法对语音环境有较高的要求,可用于有声出版物语音自动分割,以及具有良好信噪比系统的语音端点检测。  相似文献   

2.
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值.  相似文献   

3.
为了从声学语音学角度比对朝鲜语与蒙古语的相似性,提出了一种利用相似单元音在连续语音段中出现的概率分布来对比分析语音相似程度的方法.首先,采用双门限静音段检测方法将连续语音自动划分为一系列的语音段,然后采用模式识别方法检测和统计5对相似单元音在语音段首、段中和段尾的概率分布,最后通过对比分析概率分布比较了朝鲜语和蒙古语的语音相似性.对比分析结果表明,朝鲜语与蒙古语语音之间存在差异性,这两种语音的声学特征不具有相似性.本文研究方法和结果可为进一步研究朝鲜语与蒙古语的语音对比提供参考.  相似文献   

4.
通过大量实验,在基于极性翻转的语音水印嵌入的基础上,分析了基于线性预测的水印检测算法的可行性和准确率,并设计出自动水印盲检测软件,提出了一阶后滤波的改进方案,使得系统对纯净语音的提取准确率接近100%,具有一定的实用性.且该水印检测系统相对于非盲检测在抗噪方面具有明显的优越性.  相似文献   

5.
为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积(MFPH)的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC0,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则(BIC)算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高.  相似文献   

6.
针对朝鲜语数字串语音识别中单位符号容易被误判为数字的问题,提出了基于朝鲜语数字串结构特点的识别方法.首先,对事先采集好的语音样本提取特征并存储成数字模板和单位符模板;其次,将数字串测试样本切分成孤立的数字或单位符并提取特征参数;最后,根据朝鲜语数字串发音特点,即若前1个孤立词已被识别为数字,那么后1个被默认为单位符并且只与存储单位符号的模板进行匹配.实验结果表明,该方法不仅可以获得较高的正确识别率,同时提高了识别效率.  相似文献   

7.
基于小波变换的静音与语音分割新算法   总被引:6,自引:1,他引:6  
含噪语音信号的静音与语音分割,即端点检测问题是语音识别至关重要 的一步,为了提高语音分割对环境的适应性,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法,该算法首先将语音信号进行小波变换,利用小波系数去噪,然后选择小波部分子带跟踪信号的能量变化以分割语音与静音,仿真实验表明该算法在低信噪比条件下也能够有效分割语音。  相似文献   

8.
为了解决传统DTW算法准确度和效率不高的问题,提出了一种基于图像配准方法的语音特征匹配算法.该方法将MFCC参数映射为二值图像,并通过引入图像配准的方法进行模板匹配,达到了语音特征匹配的目的.实验结果表明,与传统的DTW算法相比,该方法的准确率、召回率和算法执行效率有了明显的提高.  相似文献   

9.
获取复杂声学背景下的语音流以得到有用信息是一些部门极其重要的工作.研究了在无线话带通信中实现语音流的机器自动检出.结合人的听觉外周和听觉心理的研究,提出了一种基于人耳听觉感知特性的噪声环境下语音流检测方法.该实验采用来自现场的大量的无线话带录音作为测试数据,结果表明,这种新的方法可很好地排除各种噪声的干扰,强噪声环境下表现良好.无论在抗噪方法还是在实际应用中,都有很好的应用前景.  相似文献   

10.
根据语音的发声特点,基于分析语音信号中的基音频率和语音之间的关系,提出一种在强噪声环境下实现提高语音识别率的方法,并对基于基音频能值的端点检测算法和传统语音端点检测算法进行比较.实验结果表明该方法不仅能够有效提高语音段的检测率,同时还具有计算量小、实时性高、不受噪声影响即鲁棒性好等特点.  相似文献   

11.
针对影响虹膜识别性能的眼睑及睫毛遮挡以及瞳孔边界非标准圆等情况,提出一种新的虹膜图像分割方法.采用活动轮廓模型技术计算出瞳孔的精确边界;根据归一化虹膜图像水平方向灰度信号的小波模极值点在尺度空间的演化计算得到眼睑遮挡边界上点,并利用多项式拟合确定眼睑遮挡部分;最后结合一维Gabor滤波的眼睫毛检测结果实现有效的虹膜图像分割.与现有分割方法相比,消除了瞳孔传统圆模型给归一化虹膜图像带来的畸变影响,避免了传统眼睑边界检测过程中涉及的四维参数空间搜索范围问题,降低了算法实现复杂度.在CASIA图像库上的实验结果表明该方法可将系统识别等错误率从8%降低到4.4%.  相似文献   

12.
湖南省内生矿产资源丰富,内生成矿事件主要有加里东期(以志留纪为主)、印支晚期(晚三叠世)、燕山中晚期(晚侏罗世—早白垩世)等3期。以区域矿产资料为基础,结合大地构造、成岩成矿年龄、矿床成因机制等研究成果,对上述3期内生成矿事件的构造格局控矿特征和动力机制进行探讨。①受加里东运动自东南向西北扩展以及深部岩石圈结构差异控制,加里东期湖南省自东南往西北分为成矿特征有别的3个构造带。湘中—湘东南构造岩浆带(Ⅰ)发生后碰撞花岗质岩浆活动,于局部产生与岩浆活动相关的W、萤石等成矿作用; 雪峰构造带(Ⅱ)东部的雪峰冲断带(Ⅱ1)形成了以构造活化成因为主的金矿和锑金矿; 雪峰构造带(Ⅱ)西部的武陵低缓褶皱带(Ⅱ2)及湘西北构造抬升带(Ⅲ)内形成了与寒武纪同沉积断裂活动、加里东运动后的伸展活动以及相应的热液活动有关的汞铅锌矿。②印支晚期受深部岩石圈结构差异控制,湖南省自东南至西北分为3个构造带:湘中—湘东南构造岩浆带(Ⅰ)因后碰撞减压熔融而发生大规模花岗质岩浆活动,从而于其东南部形成钨锡铅锌多金属矿床,西北部形成锑金钨多金属矿床; 雪峰构造带(Ⅱ)可能无内生热液成矿作用; 湘西北褶皱带(Ⅲ)发育小型脉型铅锌矿。③燕山中晚期,湖南省自东南往西北分为3个构造带:湘中—湘东构造岩浆带(Ⅰ)受岩石圈拆沉、软流圈上隆、陆内碰撞后期增温减压、俯冲板块崩塌等深部构造作用控制而发生大规模花岗质岩浆活动,形成了大量的有色金属矿床和金矿床; 雪峰西部构造带(Ⅱ)成矿作用弱,局部存在Au、Hg成矿作用; 湘西北褶皱带(Ⅲ)发育少量低温热液充填型萤石矿和砷矿。  相似文献   

13.
为实现多语种生成式自动摘要,基于序列到序列(Seq2Seq)模型提出了一种多语种生成式自动摘要方法.首先,按照传统的多语种自动摘要方法,将中、英、朝3个语种的语料分开训练,得到3个模型,并观察各模型在测试集上的表现; 其次,按照本文提出的多语种自动摘要法,将中、英、朝3种语言的语料放在一起共同训练出一个模型,然后运用该模型分别运行中文、英文、朝文语料的测试集,并观察模型的表现; 最后,用同一个测试集测试模型改进前后的摘要生成效果.实验结果表明,本文方法生成多语种自动摘要的效果与传统方法相近,但因本文方法只用一个模型即可实现多语种自动摘要,因此更具有适用性.  相似文献   

14.
虹膜识别是一种即时有效、被广泛应用的生物技术,其相对于人脸识别、指纹识别拥有更高的安全性能。但虹膜识别系统整体性能在很大程度上受虹膜分割精度的影响。为了有效提高虹膜识别系统性能即虹膜分割精度,本文在分析虹膜生理结构特点的基础上,大量阅读了国内外相关领域文献并分析各种算法优缺点,创新性地提出了一种新的虹膜精确分割算法,打破了传统分割算法中虹膜与瞳孔为同心圆的假设;借鉴完全局部二值模式CLBP算法思想,融合图像灰度信息和结构信息,创新性地提出了形状敏感的检测算子,有效剔除了影响分割精度的两大因素:眼睑和睫毛的干扰。同时提出了分割流程,分为两部分:虹膜粗分割与精确分割,粗分割包括外轮廓与瞳孔剔除,精分割包括眼睑与睫毛剔除。最后在中科院自动化所公开虹膜数据集CASIA-IrisV3-Interval和CASIA-IrisV1上进行了一系列有关精度和运算效率的对比实验。采用本文所提出的分割算法,在公开的OSIRIS Version 4.1虹膜识别系统上进行实验,其准确率分别提高到了97.14%和98.28%,运算时长显著减少并分别达到了0.699 s与0.758 s。  相似文献   

15.
提出一种基于稀疏神经网络的说话人分割方法,利用稀疏的单隐层神经网络提取语音的超矢量特征中说话人因子特征,然后通过K均值聚类得到每帧语音的标号来分割不同说话人,在稀疏网络的训练过程中引入了dropout技术以克服过拟合问题.在TIMIT语音数据库构成的多说话人语音数据上的实验结果表明:通过增加稀疏网络中隐层节点的个数可以提高说话人分割的效果,与贝叶斯信息准则(Bayesian information criterion,BIC)方法和稀疏自编码网络方法相比,所提基于稀疏神经网络的说话人分割方法的性能有明显提高.  相似文献   

16.
针对主流深度学习裂缝分割算法消耗大量计算资源、传统图像处理方法检测精度低、丢失裂缝特征等问题,为了实现对混凝土裂缝的实时检测和在像素级水平上分割裂缝,提出一种基于轻量级卷积神经络M-Unet的裂缝语义分割模型,首先对MobileNet_V2轻量网络进行改进,修剪其网络结构并优化激活函数,再用改进的MobileNet_V2替换U-Net参数量巨大的编码器部分,以实现模型的轻量化并提升裂缝的分割效果。构建包含5 160张裂缝图像的SegCracks数据集对提出方法进行验证,试验结果表明:优化后的M-Unet裂缝分割效果优于U-Net、FCN8和SegNet等主流分割网络和传统图像处理技术,获得的IoU_Score为96.10%,F1_Score为97.99%。与改进前UNet相比,M-Unet权重文件大小减少了7%,迭代一轮时间和预测时间分别缩短了63.3%和68.6%,IoU_Score和F1_Score分别提升了5.79%和3.14%,并且在不同开源数据集上的交叉验证效果良好。表明提出的网络具有精度高、鲁棒性好和泛化能力强等优点。  相似文献   

17.
为解决少样本朝鲜语古籍文字识别精度低的问题,提出了一种基于迁移学习的少样本文字识别方法.首先提出了一种结合传统数据增强和条件深度卷积生成对抗网络的数据增强方法,以此扩充朝鲜语古籍文字图像的训练样本数.其次,将富样本集预训练得到的模型迁移到少样本数据集的学习任务中,以此实现少样本的朝鲜语古籍文字识别.实验结果表明,提出的数据增强方法能够满足模型预训练和少样本的学习要求,且VGG16、ResNet18和ResNet50 3种网络模型在测试集上均获得良好的识别性能,其中ResNet50的识别准确率最高(99.72%).因此,该方法可有效解决小样本的朝鲜语古籍文字识别问题,并可为其他语种的小样本文字识别提供参考.  相似文献   

18.
图像分割是按照一定的规则,将图像中具有特殊意义的区域划分为若干个互不相交的子区域,是从图像处理到图像分析的关键环节,传统分水岭图像分割方法是一种应用较为广泛的技术,具有快速、简单的优点,但该方法易受噪声干扰,分割结果易丢失边缘重要信息,出现过分割现象。为改善传统分水岭图像分割方法存在的过分割问题,提出了一种基于自适应结构元素的改进分水岭图像分割方法。首先,利用图像像素点邻域的局部密度、对称度及边缘特征构造形状可变的自适应结构元素,确保其与图像目标几何结构具有较强的一致性;其次,利用该结构元素获取图像形态学梯度,提高目标边缘的定位精度;将L0范数梯度最小化和形态学开闭混合重建相结合修正梯度图像,减少梯度图像中的局部无效最小值点,抑制过分割现象的产生;最后对修正后的梯度图像进行分水岭分割,实现图像目标区域的精确分割。实验结果表明,该方法能够有效抑制过分割现象,提高目标边缘定位的准确性,具有较高的分割精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号