首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
智能麦克风阵列语音分离和说话人跟踪技术研究   总被引:1,自引:1,他引:0       下载免费PDF全文
杜江  朱柯 《电子学报》2005,33(2):382-384
本文介绍一种新的基于麦克风阵列的语音分离和说话人跟踪技术.该技术使用麦克风阵列,形成一个指向感兴趣说话人的波束来增强信号,并通过方向置零来抑制其他说话人的声音和噪声,同时用自适应算法跟踪说话人的方位变化.仿真验证了该技术的有效性.与常规的自适应算法相比,该算法不需训练序列,具有显著的优势.  相似文献   

2.
本征音子说话人自适应算法在自适应数据量充足时可以取得很好的自适应效果,但在自适应数据量不足时会出现严重的过拟合现象。为此该文提出一种基于本征音子说话人子空间的说话人自适应算法来克服这一问题。首先给出基于隐马尔可夫模型-高斯混合模型(HMM-GMM)的语音识别系统中本征音子说话人自适应的基本原理。其次通过引入说话人子空间对不同说话人的本征音子矩阵间的相关性信息进行建模;然后通过估计说话人相关坐标矢量得到一种新的本征音子说话人子空间自适应算法。最后将本征音子说话人子空间自适应算法与传统说话人子空间自适应算法进行了对比。基于微软语料库的汉语连续语音识别实验表明,与本征音子说话人自适应算法相比,该算法在自适应数据量极少时能大幅提升性能,较好地克服过拟合现象。与本征音自适应算法相比,该算法以较小的性能牺牲代价获得了更低的空间复杂度而更具实用性。  相似文献   

3.
基于码本的说话人自适应方法   总被引:1,自引:0,他引:1  
吕津  赵明生  王作英 《电子学报》2001,29(4):456-460
本文提出了一种基于码本的说话人自适应方法.它可以将变换方法和Bayes估计法这两大类说话人自适应方法的优点有机的结合起来,既能实现快速的说话人自适应,还具有良好的一致渐进性.自适应过程可分为两个阶段:在第一阶段,用由大量参考说话人的语音码本构成的线性组合来逼近用户的语音码本.此时只需要很少的自适应训练数据就可以用基于Rosen梯度投影法的优化算法计算出线性组合中各码本的最佳权值.在第二阶段,码本的最佳线性组合被用作用户码本的先验估计值.随着更多自适应训练数据的获得,系统对用户码本进一步进行Bayes估计,从而可以实现累进的自适应.作者将该方法应用于说话人无关的连续汉语语音识别系统.一系列的对比实验表明该自适应方法很有前途.  相似文献   

4.
赵力  邹采荣  吴镇扬 《电子学报》2002,30(7):967-969
本文提出了一种新的语音识别方法,它综合了VQ、HMM和无教师说话人自适应算法的优点,在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立FVQ/HMM,同时采用基于模糊矢量量化的无教师自适应算法,来改变FVQ/HMM的各状态的码字,从而实现对未知说话人的码本适应.本文通过非特定人汉语数码(孤立和连续数码)语音识别实验,把该新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法的自适应和识别效果优于基于CHMM的方法.  相似文献   

5.
屈丹  张文林 《通信学报》2015,36(9):47-54
本征音子说话人自适应方法在自适应数据量不足时会出现严重的过拟合现象,提出了一种基于稀疏组LASSO约束的本征音子说话人自适应算法。首先给出隐马尔可夫—高斯混合模型下本征音子说话人自适应的基本原理;然后将稀疏组LASSO正则化引入到本征音子说话人自适应,通过调整权重因子控制模型的复杂度,并通过一种加速近点梯度的数学优化算法来实现;最后将稀疏组LASSO约束的自适应算法与当前多种正则化约束的自适应方法进行比较。汉语连续语音识别的说话人自适应实验表明,引入稀疏组LASSO约束后,本征音子说话人自适应方法的性能得到了明显提高,且稀疏组LASSO约束方法优于l1、l2和弹性网正则化方法。  相似文献   

6.
声音转换技术的研究与进展   总被引:20,自引:0,他引:20       下载免费PDF全文
左国玉  刘文举  阮晓钢 《电子学报》2004,32(7):1165-1172
声音转换是一项改变说话人声音特征的技术,可以将一人的语音模式转换为与其特性不同的另一人语音模式.声音转换算法的目标是确定一个什么样的模式转换规则,使转换语音保持第一个说话人原有语音信息内容不变,而具有第二个说话人的声音特点.本文介绍了当前声音转换技术领域的研究状态,主要分析现有声音转换技术中各种转换算法的实现原理,描述声音转换系统性能的各种评估方法,最后给出了对声音转换技术的简要评述和展望.  相似文献   

7.
汉语数码语音识别自适应算法   总被引:4,自引:0,他引:4  
说话人自适应是提高非特定人语音识别性能的有效方法之一。本文将MAP算法应用于汉语数码语音识别中,并讨论了几种加快自适应速度的方法以及自适应对非自适应人的影响。实验表明,MAP算法可以有效地降低汉语数码识别对被适应人的误识率,而且对非自适应人性能影响很小。  相似文献   

8.
吕萍  王作英  陆大 《电子学报》2001,29(Z1):1759-1761
快速说话人自适应算法在非特定人连续语音识别的应用中有重要意义.现在流行的自适应算法多数只考虑均值的自适应.本文提出的自适应算法可以快速的对协方差矩阵进行自适应.该算法是用高斯相似度度量协方差矩阵间的距离,并由此测度建立了反映协方差矩阵结构关系的二叉决策树.树的每个中间节点包含一个类质心.在决策树基础上,训练多个与特定人模型相关的类质心.自适应时,通过对这些类质心进行线性插值得到自适应的协方差矩阵.实验结果表明,该方法能够在仅有一句自适应数据的情况下,使系统误识率由29.49%下降到27.55%.  相似文献   

9.
张庆芳  赵鹤鸣  苏秦 《信号处理》2005,21(Z1):200-203
与文本无关的说话人识别方法是当前说话人识别技术的研究重点.本文将自组织特征映射(SOFM)网络用于矢量量化中码书的形成,改进了训练算法,并基于改进算法进行了与文本无关的说话人识别.经实验结果证明,本文的方法改善了码本的性能,提高了说话人识别的识别率.  相似文献   

10.
介绍了一个基于GMM实时说话人识别系统的设计与实现,系统具有实时说话人辨认和实时说话人确认功能。在实验室条件下,对不同的高斯混合密度个数及采样率进行了测试,测试了模型的自适应性能。实验表明系统具有较好的识别准确率。  相似文献   

11.
旋转均值滤波用于提高红外点目标图像信噪比   总被引:2,自引:0,他引:2  
当距离红外传感器很远时,目标在红外图像中表现为点目标。充分利用点目标,背景杂波及噪声在空间域中的表现形式,并结合均值滤波滤除噪声的特性,提出了一种新的滤波方法——旋转均值滤波法。将此算法运用在信噪比不大于3的红外点目标图像中,实现了背景抑制,突出目标以及提高信噪比作用,并能够满足实时处理的要求。  相似文献   

12.
一种基于噪声估计的语音激活检测算法   总被引:1,自引:0,他引:1  
针对当前语音激活检测算法在低信噪比和复杂噪声模型的环境下性能损失的问题,提出了一种基于噪声估计的语音激活检测算法,通过对背景噪声进行自适应估计,得到准确的信噪比门限,同时利用估计背景噪声对短时谱进行白化处理,从而使得谱熵判决准则得以适用于复杂噪声模型的环境。实验证明,算法在低信噪比和复杂噪声模型下性能优于G.729B和AMR中的语音激活检测算法。  相似文献   

13.
刘静  贲德  周新刚 《现代雷达》2015,(12):25-28
周期模糊函数表示周期调制连续波信号的时延-频偏平面的相关,不同的信号具有不同的周期模糊函数。针对雷达中频信号的信噪比估计,提出了基于周期模糊函数理论的信噪比估计方法。根据信号和噪声在周期模糊函数中的不同位置具有不同的表现特征,推导了在高斯白噪声背景下基于周期模糊函数的信噪比估计公式,给出了实现算法,同时和其他信噪比估计算法进行了对比仿真分析。结果表明,基于周期模糊函数的信噪比估计方法,特别是对低信噪比情况下,估计精度高,算法简单,易于工程实现。  相似文献   

14.
体全息存储图像的信噪比研究   总被引:7,自引:1,他引:7  
根据全息存储二值图像的特性,提出了评价重构图像信噪比的方法,并对掺铁铌酸锂晶体中角度复用全息存储图像的信噪比作了详尽的定量研究,包括存储过程中图像信噪比的动态演变,以及页内和页间串扰对重构图像信噪比的影响。测量结果表明,串扰噪声引起的信噪比下降趋势与理论分析一致,图像信噪比的恶化主要是由于相干光学噪声和测量仪器的噪声;实验结果还表明即使在较小的衍射效率下也可获得较好的存储图像信噪比,从而为存储容量和图像质量之间的最佳均衡创造了条件  相似文献   

15.
在某空间项目中,需要使用一款指定的CCD传感器研制一套用于空间成像的CCD摄像机系统,并且要求图像的帧频高于CCD传感器的标准帧频。简单的超频读出CCD会使摄像机的信噪比下降。文中首先分析了CCD摄像机在空间条件下影响成像信噪比的多种原因,发现读出噪声对输出图像的信噪比影响是最大的。使用区域倍频读出方法来提高CCD摄像机的输出帧频,即在图像的水平和垂直方向都使用4倍的时钟读出部分像元。最后把区域倍频读出CCD的图像信号和整体超频读出CCD的图像信号进行了信噪比对比检测,测试结果表明区域倍频读出的CCD图像质量较好。  相似文献   

16.
分析了使用差分探测器的偏振光学相干层析(PS-OCT)统噪声,讨论影响系统信噪比(SNR)的因素,模拟SNR随这些因素的变化趋势,根据分析得出实现最佳SNR的参数条件,为提高PS-OCT系统SNR提供了理论依据.相关实验验证了模拟结果的正确性.  相似文献   

17.
新型机载多脉冲激光雷达目标信号模拟器   总被引:2,自引:0,他引:2       下载免费PDF全文
研制多脉冲激光雷达目标信号模拟器,用以评估回波数字信号处理算法及其实现平台的性能。首先,介绍了目标信号的主要组成以及回波信噪比的两种定义。接着,基于激光雷达方程及1.064μm激光器的辐射激光的光电接收实验,获取信号波形并对目标回波信号组成进行分析,结合空中目标的回波脉冲展宽建立了机载脉冲激光雷达目标回波信号模型。之后,提出了依据电压信噪比产生回波观测信号的方法。最后,给出了基于"FPGA+高速D/A+USB2.0数据传输"的目标信号模拟器软硬件实现,可为回波信号处理器提供信噪比为1-9的静、动目标回波及主波信号。  相似文献   

18.
高功率倍频激光系统信噪比测试   总被引:1,自引:1,他引:0  
用硅光电导开关测试高功率激光系统的信噪比,测试范围高至106。讨论了基频光与倍频光间的信噪比关系及如何测试倍频光信噪比等问题  相似文献   

19.
对于水下图像预处理的滤波中,采用Non-local means算法,其效果很好,在保持图像边缘的同时,较大程度地剔除了噪声,适合于水下颗粒噪声较明显的图像预处理。通过与中值滤波、均值滤波等常用算法对比,也证明了这一点,较大地提高了信噪比。  相似文献   

20.
水下激光距离选通成像系统的模型与极限探测性能研究   总被引:7,自引:1,他引:7  
为了改善现有水下激光距离选通成像建模方法在收发时序和器件特性方面的不足,提出了一种改进的系统模型。该模型以一维(1D)方波信号为研究对象,通过计算该信号的输出信噪比来评价成像系统的性能。模型考虑了水下激光脉冲的时域展宽和增强型电荷耦合装置(ICCD)的增益噪声特性以对现有模型的不足进行改进。通过模拟计算与实际水下激光距离选通成像系统所采集的图像相对比的方法验证了模型正确性,又通过对系统在不同水质下极限探测距离的仿真计算表明距离选通技术对人形暗目标的探测、识别和认清距离达到了9,7.5和7个衰减长度,从而证明了距离选通技术能够有效探测劣质水况下的中小目标。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号