首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
李鹏  关勇  刘文举  徐波 《自动化学报》2009,35(8):1087-1093
在回顾了基于语音客观质量评估和计算听觉场景分析的单声道混合语音分离方法的基础上, 针对该方法所采用的ITU-T P.563语音客观质量评估标准存在的使用限制以及计算量大的缺点, 提出了一种采用基于时域包络表示的语音客观质量评估算法来替代P.563算法的单声道混合语音分离方法. 该方法在几乎不降低原方法分离性能的前提下, 大大节约了算法运行所需的时间和资源消耗.  相似文献   

2.
针对许多计算听觉场景分析系统无法很好地解决多说话人混合语音信号分离的问题,提出了一种基于多基音跟踪的单声道混合语音分离系统。该系统充分利用了多基音跟踪研究的最新成果,通过将多基音跟踪得到的目标语音和干扰语音的基音轨迹信息结合到分离系统中,有效地改善了分离系统在包括多说话人混合在内的多种干扰情况下的分离效果,为多说话人语音分离问题的解决提供了新的思路。  相似文献   

3.
研究红外图像目标分割快速优化问题。在高分辨率红外图像的分割中,红外图像存在数据量大、目标的边缘模糊和噪声较大等导致分辨率低和实时性差。为了快速准确分割,提出基于低尺度分割阈值预测的快速红外图像分割方法(LFIRS)。首先建立尺度阶数计算模型以确定保留原始红外图像目标基本信息所需的最小尺度,在分析多尺度过程对具有目标/背景强相关特性的红外图像进行分割阈值,建立多尺度红外图像分割阈值的相关模型(CLM),结合经典二维阈值法得到的最低两个尺度的阈值CLM模型参数,可以通过CLM模型与最小尺度的快速获取原始尺度的分割阈值,实现红外图像的快速分割。实验结果表明,改进方法提高了图像分辨和分割速度,且改善了分割效果。  相似文献   

4.
一种基于听觉模型的语音特征提取方法   总被引:2,自引:0,他引:2  
提出了一种基于听觉模型的语音特征提取方法,从信号的过零点获得频率信息,从振幅值和非线性压缩获得强度信息,并对这种方法进行了误差分析,证明其噪声的鲁棒性。  相似文献   

5.
一种基于彩色图像分割的车牌检测方法   总被引:2,自引:0,他引:2  
提出一种彩色图像车牌检测方法,主要包括三个步骤,首先对车牌图像执行多尺度区域生长分割,然后在分割结果中进行车牌区域的粗定位,最后对粗定位提取的车牌区域作精确定位分析.区域生长分割方法可以产生封闭的区域,容易提取其形状信息,而长矩形是车牌目标一个显著特征,因此可以通过形状信息检测车牌.在图像分割中,采取多尺度的分割方法,生成多个不同细节程度的分割结果.在每个分割图像中搜索具有车牌外形特征的图像区域,初步检测出候选车牌目标.根据车牌字符的大小和笔画特征,对候选车牌区域进行精确判别分析,得到最终的车牌检测结果.实验部分验证了车牌检测的有效性.  相似文献   

6.
基于深度学习语音分离技术的研究现状与进展   总被引:8,自引:0,他引:8  
现阶段, 语音交互技术日益在现实生活中得到广泛的应用, 然而, 由于干扰的存在, 现实环境中的语音交互技术远没有达到令人满意的程度. 针对加性噪音的语音分离技术是提高语音交互性能的有效途径, 几十年来, 全世界范围内的许多研究者为此投入了巨大的努力, 提出了很多实用的方法. 特别是近年来, 由于深度学习研究的兴起, 基于深度学习的语音分离技术日益得到了广泛关注和重视, 显露出了相当光明的应用前景, 逐渐成为语音分离中一个新的研究趋势. 目前已有很多基于深度学习的语音分离方法被提出, 但是, 对于深度学习语音分离技术一直以来都缺乏一个系统的分析和总结, 不同方法之间的联系和区分也很少被研究. 针对这个问题, 本文试图对语音分离的主要流程和整体框架进行细致的分析和总结, 从特征、模型以及目标三个方面对现有的前沿研究进展进行全面而深入的综述, 最后对语音分离技术进行展望.  相似文献   

7.
人耳听觉系统能够从嘈杂的环境中筛选出自己感兴趣的语音,基于计算听觉场景分析的方法,论文采用倒谱法提取语音基音周期轨迹,以连续的基音周期轨迹为线索,按基音频率的整数倍提取各次谐波的频谱,再通过傅里叶逆变换重构分离后的语音。实验表明,在几种典型噪音环境下,该方法能有效将目标语音从背景噪声中分离,信噪比(SNR)和评价意见分(MOS)得到一定的提升,平均增益分别为5.67dB和0.36。  相似文献   

8.
人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离.针对单通道浊语音分离的问题,提出了一种以基音为线索的浊语音信号分离算法.在白噪声、鸡尾酒会噪声等六种噪声干扰条件下,通过仿真实验结果表明,相比于传统的谱减法,语音分离算法的输出信噪比平均提高了7.47 dB,并有效抑制了干扰噪声,改善了分离效果.  相似文献   

9.
10.
葛宛营  张天骐 《计算机应用》2019,39(10):3065-3070
单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针对此问题,提出一种基于计算听觉场景分析(CASA)的时频掩蔽估计与优化算法。首先,通过直接判决(DD)算法估计先验信噪比(SNR)并计算初始掩蔽;其次,利用噪声与带噪语音在Gammatone频带内的互相关(ICC)系数来计算噪声的存在概率,结合带噪语音能量谱得到新的噪声估计,减少原估计噪声中的过估成分;然后,利用优化算法对初始掩蔽进行迭代处理以减少其中因噪声过估而存在的误差并增加其中的目标语音成分,在满足条件后停止迭代并得到新的掩蔽;最后,利用新的掩蔽合成增强语音。实验结果表明在不同的背景噪声下,相比优化前,新的掩蔽使增强语音获得了较高的主观语音质量(PESQ)和语音可懂度(STOI)值,提升了语音听感与可懂度。  相似文献   

11.
基于计算听觉场景分析的理论,使用onset/offset线索完成混合语音分离研究。将经过外围模型处理后的数据,在时域和频域上分别检测并匹配onset/offset,利用时频图上的onset/offset信息合并片段,实现语音分离。通过对3类混合语料进行实验分析,得出onset/offset线索可以同时处理清音和浊音,对声音混合类型没有限制,能得到较好的分离效果。  相似文献   

12.
人耳听觉定位的一个主要因素是ITD。在传统的计算声场景分析方法中,对ITD的估计采用对双耳神经发放率做互相关求得。但该方法具有计算量大和抗噪声能力弱两大缺陷,给实现运动声源实时定位带来了巨大瓶颈。对较新的过零时间差(ZCTD)方法进行了改进,采用Teager能量算子(TEO)提取语音包络截取可靠语音段估计ITD,避免了ZCTD方法中用信噪比的估值提取可靠ITD的繁琐步骤,能够更快速、准确地估计ITD,具有较强的抗噪声能力。将该方法运用到运动声源定位上,提出了基于过零点双耳时间差的运动声源定位模型,通过仿真实验验证了其实现运动声源实时定位的可行性。  相似文献   

13.
申庆超  夏秀渝  李冰  周宁 《计算机应用》2011,31(Z2):176-180
分段是计算声场景分析中的一个重要步骤.传统分段是基于响应能量和相邻通道的互相关性,易受干扰,会忽略清音,且计算量大.研究了另一种分段方式:基于语音的起始截止时刻分段.采用一种可纠正失真的包络求取算法获得较准确的信号包络,然后通过卷积高斯函数和低通滤波器进行频域时域平滑处理,并提出一种简单实用的去除系统延迟的方法,最后检测起始截止时刻并将其组合成段.仿真实验表明此分段方法能准确提取起止时刻,完成强噪声环境下语音信号的分段.  相似文献   

14.
传统二维Otsu算法存在计算复杂度高、实时性差等缺点。针对这一不足,受生物群体成员间协作关系的启示,对克隆免疫算法进行改进,提出了一种基于种内协同的克隆选择算法(Clonal Selection Algorithm based on Cooperation within Species,CSACS),将其与克隆选择算法(Clonal Selection Algorithm,CSA)进行对比测试,将其应用于二维Otsu图像分割。测试实验表明:该算法能加快收敛速度,具有较好的实时性,且分割效果较为理想。  相似文献   

15.
由于人体运动捕获数据的固有非线性,线性方法并不总是能够有效地找到运动捕获数据的内在维度,针对这种情况,提出了基于主测地线分析(PGA)和概率主测地线分析(PPGA)的自动分割方法。这两种方法都将人体运动视为一个有序的姿势序列,并在姿势序列有局部变化处对运动进行分割。基于PGA的分割方法是在运动局部模型的内在维度突然增长处分配一个分割点,基于PPGA的分割方法是在姿势分布发生改变时放置分割点。实验结果表明,该方法都能实现自动分割,且具有较好的分割结果。  相似文献   

16.
影像分割的区域合并技术中,传统的采用区域邻接图的方法存在着数据结构和算法复杂、难以扩充和维护、可考虑的特征因子有限以及空间浪费严重等问题。对此,提出了一种新的区域合并方法,提供了一套采用面向对象技术解决区域合并问题的新框架。在该框架下,区域的相异度指标、属性、邻接关系和行为可根据需要自由定义、扩充和修改,算法的稳定性和可维护性得到提升,合并过程被充分简化。在此基础上提出了多尺度合并区域的改进方法,并对等级队列的构建机制进行了优化。最后通过多尺度的对比实验,证明该方法不但能保证区域合并的精度,而且可以显著提高执行效率。  相似文献   

17.
提出了一种利用色彩-纹理综合特征进行彩色图像分割的新方法。首先利用HSI色彩模型提取图像的色彩信息,其次,采用与方向无关的Gabor变换对彩色图像的强度信息进行处理,提取图像的纹理基元。根据上述过程所获得的色彩-纹理特征,采用核模糊聚类方法实现彩色图像的自动分割。实验结果表明,所提出的方法综合利用了图像的色彩、纹理信息,使彩色图像的分割结果更准确。  相似文献   

18.
针对压缩域视频的运动对象分割在复杂背景下分割精度不高的问题,提出一种基于最新压缩编码HEVC的运动分割方法。首先从HEVC压缩码流中提取块划分和相对应的运动矢量信息,并分别在帧内和帧间对运动矢量进行空域和时域的标签分类,然后利用MRF模型对标签场进行运动一致性估计,得到更精确的运动目标,最后输出MRF分割后形成的掩模信息。通过实验证明,该运动分割方法能够达到有效并可靠的分割效果,尤其对于多目标运动的视频分割效果优于其他比较的方法。  相似文献   

19.
针对图像中线条的重构与理解,基于多尺度空间理论,提出通过多尺度、多角度高斯-拉普拉斯滤波的最大能量响应,对线条进行自适应增强,同时获取线条的尺度、角度信息,利用非极大值抑制对线条实现检测,利用已获取的线条尺度与角度信息对线条进行重构。实验结果表明该线条重构算法的有效性。  相似文献   

20.
在图像分割的多种方法中,模糊C均值(FCM)聚类是最简单有效的。可能性C-均值算法(PCM)作为FCM的同类算法具有更佳的聚类性能和概率解释性,但无论是FCM还是PCM均受隶属度的约束影响使其对噪声点和野值点较为敏感。针对以上问题,提出了一种新的称之为类间极大化的PCM算法(MPCM)聚类算法。该算法考虑了对类间的惩罚,通过调控参数[λ],拉大类中心之间的距离,实现图像中像素点的最佳分类。给出了人工合成纹理图像、真实图像以及带有椒盐噪声的真实图像的实验,结果表明算法在图像分割效果上优于传统的聚类分析算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号