期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

桂苹吴镇扬赵力王维新《电声技术》2003,(10):11-14

文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征，运用VQ技术实现了说话人自动识别。在10个说话人，1800个汉语数字和单词语音的语音库上进行了系统的识别实验，其中单音节语音的平均识别率达到了92％，双音节语音达到了96．67％，四音节语音达到了97．67％。相似文献

2.

复杂背景下声纹识别系统的研究方法综述

房安栋刘军万《电子世界》2013,(3):97-99

声纹识别是生物特征识别领域的一个重要分支。它采用语言数据自动地鉴定测试者身份。本文研究复杂背景下的声纹识别系统的设计与实现,首先,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;其次,在特征提取阶段,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数(MFCC),将得出的两种参数组成一个特征矢量作为声纹特征;最后声纹识别阶段,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,即判定为说话人。相似文献

3.

基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用

张玲华郑宝玉杨震《电子与信息学报》2006,28(10):1786-1789

通过对纯净语音及含噪语音短时谱的分析比较,提出了一种基于基音频率及其谐波结构的新的语音特征参数。实验表明,与传统的倒谱特征相比,新特征对加性白噪声相对较不敏感,在闭集文本无关说话人识别中,新特征可以在加性白高斯噪声环境下提高系统的说话人识别率。相似文献

4.

一种利用轻量化CNN的说话人识别方法

姚晨伟高勇《通信技术》2023,(3):276-281

针对传统说话人辨认任务中相位特征容易被人忽视的情况，对说话人辨认任务提出了结合幅度和相位特性的短时傅里叶变换（Short-Time Fourier Transform,STFT）+基于相位的谱根倒谱系数（Phase-based Spectral Root Cepstral Coefficients,PSRCC）特征融合方案，并且将轻量级卷积神经网络模型MobilenetV3与CA注意力机制融合作为后端分类器。通过5种不同特征选择方案进行说话人辨认对比实验，得到相应准确率。结果表明，所提出的说话人识别模型在开源声纹识别数据集VOXCELEB-1的测试集上取得了83.23%的准确率，该模型在超越VGGVOX基线系统81.82%测试准确率的同时，模型大小和参数量分别减少了75.98%和76.32%。相似文献

5.

基于统计匹配的VoIP说话人特征补偿算法

唐晖李弼程屈丹张连海《信号处理》2009,25(3)

在VoIP说话人识别中,当使用原始语音(未经过编译码处理)训练的说话人模型识别经过语音编译码处理的测试语音时,系统的识别性能会发生下降.本文给出了一种基于统计匹配和EM(期望最大化)算法的VoIP说话人特征(12阶的LPCC系数)补偿算法,其中对假设失真特征与未失真识别特征间符合非线性(二次函数型)和线性函数关系时的函数参数进行了估计,并使用得到的补偿函数对失真特征进行补偿.实验结果表明,该特征补偿算法对VoIP中广泛使用的G.729 8kb/s、G.723.1 6.3kb/s、G.723.1 5.3kb/s编译码所造成的识别性能下降有较大的改善,其性能也优于CMS(倒谱均值减)方法. 相似文献

6.

一种具有鲁棒性能的说话人确认系统研究

《信息技术》2017,(8):16-20

与文本无关的说话人确认系统在纯净语音环境下具有较高的识别率,而在嘈杂的噪声环境下识别率会发生显著降低的现象。针对此问题,文中对系统的两个方面进行了改进:在前端处理方面使用了由多窗谱估计的谱减法和子空间法组成的二级去噪系统,在特征提取方面对梅尔倒谱系数(MFCC)特征参数添加了基音周期的一维特征信息并且对融合后的特征参数进行规整处理。实验结果表明,文中构建的说话人确认系统在噪声环境下的识别率有了很大的提升。相似文献

7.

应用于语音识别片上系统的语音检测算法 总被引：2，自引：0，他引：2

梁维谦许海国陈一宁刘加刘润生《电路与系统学报》2003,8(2):66-70,79

语音识别技术的研究已经进入实用化阶段，而实用化语音识别系统中的一个关键技术就是可靠的语音检测。本文提出了一种基于有限状态机模型的实时语音检测算法(FSM-SD)。采用对数最大似然判决帧能量检测器和过零率检测器控制各状态之间的跳转关系。针对语音识别中的MFCC(Mel频标倒谱系数)和LPCC(线性预测倒谱参数)特征提取过程，分别得到两种不同的帧能量计算方法。将FSM-SD应用到在OAK DSP上实现的小词表汉语语音识别系统，通过实验验证了其对系统识别性能和噪声稳健性的有效保证。相似文献

8.

基于LPC的藏语语音基音周期的检测分析

《现代电子技术》2015,(16)

基音周期是语音信号的重要参数,提取藏语语音基音周期为藏语语音识别和藏语语音合成奠定很重要的基础。这里在分析藏语发音特点的基础上进行基于LPC的藏语语音基音周期提取算法的分析,实践表明,该方法更加符合小信噪比藏语音信号基音周期和提取。在传统LPC分析方法的基础上结合自相关法和倒谱法,分析计算平均相对误差,总结出了符合藏语语音特点的特征提取算法。相似文献

9.

基于FVQ的说话人识别系统的DSP实现 总被引：5，自引：3，他引：2

余华赵力吴镇扬《电声技术》2004,(8):35-37

运用TMS320C5416实现了说话人自动识别系统，系统利用一种新的语音信号r阶的倒谱线性回归系数等参数构成识别的特征矢量集，运用模糊矢量量化技术实现了与文本有关的说话人识别。实验结果表明系统具有识别精度高、识别速度快等特点，是一种有效的说话人自动识别的硬件实现方法。相似文献

10.

基于概率DP匹配法的噪声环境下说话人识别方法的研究 总被引：1，自引：0，他引：1

王吉林赵力邹采荣《电声技术》2005,(8):47-49,66

提出了一种在噪声环境下利用复数语音帧段主分量特征输入的概率DP匹配的说话人识别算法。通过对噪吉环境下与文本无关的说话人识别实验，验证了这种方法的有效性。相似文献

11.

一种改进的说话人识别系统

袁玉倩于明董浩王哲《信息安全与通信保密》2006,(7):125-126

论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。相似文献

12.

基于轨迹一致性检测的空间碎片天基识别方法

下载免费PDF全文

雷韫璠王龙钟红军张辉武延鹏《红外与激光工程》2022,51(11):20220076-1-20220076-10

针对空间碎片天基观测量与编目数据库在轨关联难题,建立天基光学相机对空间碎片的观测模型,分析在轨应用环境对观测信息的影响,基于碎片轨迹一致性检测设计识别方法。为适应在轨应用的需求,提出了DTW与轨迹形貌差异量化检验融合的空间碎片识别方法。首先,依据DTW原理筛选出与待检测真实轨迹形貌最接近的预报轨迹;进一步,将初选相似轨迹之间的形貌差异量化为轨迹间总误差的标准差;最后,通过统计量检验实现轨迹一致性确认,轨迹一致则碎片成功识别。对所提出方法与轨迹直线拟合参数误差检验识别法进行碎片识别稳定性的仿真与实验对比。结果表明:DTW与轨迹形貌差异量化检验融合识别法是一种更稳定的碎片识别方法,对仿真及实验中的全部碎片及低轨卫星均能实现稳定识别,较轨迹直线拟合参数误差检验识别法稳定性明显提升。文中提出方法具有不受碎片运动特性、观测环境等因素影响的特点,可在卫星感知与防护领域广泛应用。相似文献

13.

Discriminative analysis of lip motion features for speaker identification and speech-reading.

H Ertan Cetingül Yücel Yemez Engin Erzin A Murat Tekalp 《IEEE transactions on image processing》2006,15(10):2879-2891

There have been several studies that jointly use audio, lip intensity, and lip geometry information for speaker identification and speech-reading applications. This paper proposes using explicit lip motion information, instead of or in addition to lip intensity and/or geometry information, for speaker identification and speech-reading within a unified feature selection and discrimination analysis framework, and addresses two important issues: 1) Is using explicit lip motion information useful, and, 2) if so, what are the best lip motion features for these two applications? The best lip motion features for speaker identification are considered to be those that result in the highest discrimination of individual speakers in a population, whereas for speech-reading, the best features are those providing the highest phoneme/word/phrase recognition rate. Several lip motion feature candidates have been considered including dense motion features within a bounding box about the lip, lip contour motion features, and combination of these with lip shape features. Furthermore, a novel two-stage, spatial, and temporal discrimination analysis is introduced to select the best lip motion features for speaker identification and speech-reading applications. Experimental results using an hidden-Markov-model-based recognition system indicate that using explicit lip motion information provides additional performance gains in both applications, and lip motion features prove more valuable in the case of speech-reading application. 相似文献

14.

基于局部尺度特征描述和改进DTW技术的局部轮廓匹配算法

下载免费PDF全文

徐贵力赵妍姜斌王正盛李开宇郭瑞鹏《电子学报》2016,44(1):135-142

基于轮廓的图像匹配是计算机视觉领域中的重要问题,但是目前尚未有较成熟的算法能够很好地解决局部轮廓匹配问题及非相似变换和非刚体变换引起的轮廓形变问题.根据局部轮廓结构在产生形变时具有相对稳定性的规律及融合轮廓局部信息和全局信息的轮廓描述思想,本文提出了一种具有尺度、旋转、平移不变性,形变鲁棒性和初始点无关性的局部尺度轮廓描述算法.在此基础上,针对线性匹配方法效果不佳以及传统DTW技术约束路径的线性度不满足轮廓采样特性要求的问题,提出一种基于改进DTW技术的轮廓匹配算法,即结合轮廓采样特性设置九宫格的路径约束条件,以旋转角度为参数,计算全局最佳匹配路径.实验结果表明,对于存在尺度、平移、旋转及形变关系的两轮廓,该方法能较好地实现轮廓间的局部匹配,并且其匹配准确率平均约为92%,较HD算法提高了30%,较传统DTW算法提高了26%. 相似文献

15.

基于分组标识的网络流量抽样测量模型 总被引：11，自引：0，他引：11

下载免费PDF全文

程光龚俭丁伟《电子学报》2002,30(Z1):1986-1990

PSAMP建议流量抽样测量模型应该简单且能够满足各种测量应用要求,为此,文章提出基于报文标识的流量抽样测量模型.对CERNET主干网络流量IP报头各字段的进行随机性分析,结果表明标识字段16比特统计上满足抽样掩码匹配字段的随机性要求.并提出基于标识字段的多掩码抽样测量算法及其修正算法,实验验证其抽样样本既能满足流量统计行为研究,又能进行网络行为研究. 相似文献

16.

雷达地图匹配制导中的共性特征提取与匹配方法 总被引：5，自引：1，他引：5

张俊陈学广柳健《电子学报》1999,27(10):58-61

本文针对雷达地图匹配制导中的共性特征提取和雷达与地图匹配这一特定问题,应用小波变换多尺度分析提取共性特征．提出基于人工神经元网络的雷达地图匹配方法,并且给出相应的试验结果．因为Ｈｏｐｆｉｅｌｄ模型可以由集成电路实现．本文算法可以实时地完成．试验表明采用本匹配方法能够解决雷达地图匹配问题,获得比传统匹配方法,例如平均绝对差算法更高的匹配定位精度和匹配概率相似文献

17.

基于压缩感知的稳健性说话人识别 总被引：1，自引：1，他引：0

单进芮贤义《电声技术》2011,35(2):61-63

阐述了在噪声条件下,将基于压缩感知理论的丢失数据重建技术应用于说话人识别系统的系统前端.首先使用Mel滤波器组将带噪语音信号转换成Mel频谱,然后利用带噪MeI谱中可靠数据重建不可靠数据,最后从重建的Mel频谱中提取Mel倒谱特征参数用于说话人识别.稳健性实验结果表明,该方法能够提高在噪声环境下说话人系统的识别率. 相似文献

18.

基于小波变换的鲁棒型特征提取及说话人识别 总被引：4，自引：0，他引：4

芮贤义俞一彪《电路与系统学报》2005,10(5):129-132

说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。相似文献

19.

基于说话人分类技术的分级说话人识别研究 总被引：3，自引：0，他引：3

下载免费PDF全文

刘文举孙兵钟秋海《电子学报》2005,33(7):1230-1233

识别正确率和抗噪性能固然是说话人识别的研究重点,但识别响应速度也是决定系统实用化的关键所在.本文成功地提出了基于说话人分类技术的分级说话人辨识方法,极大地提高了系统运行速度,随着注册说话人数的增多,较之传统的说话人辨识方法,其优势更加明显.同时在说话人确认中,该方法的使用,进一步提高了确认的正确率,有效地降低了错误接受和错误拒绝率.本文提出的可信度打分方法,也一定程度上改进了系统的性能.实验表明:基于说话人分类技术的说话人辨识方法使系统的运行速度平均提高了3.5倍,对说话人确认等误识率和最小误识率平均下降了53.75%. 相似文献

20.

基于MFCC的说话人识别系统 总被引：7，自引：0，他引：7

郭春霞裘雪红《电子科技》2005,(11):53-56

说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数（Mel-Frequency Ceptral Coefficients ,MFCC）作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC. 相似文献