期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

说话人识别方法概述

武光利《硅谷》2012,(19):179+189-179,189

说话人识别是语音识别的一个重要的分支,是当前的研究热点之一。首先介绍说话人识别的基本原理,然后介绍说话人识别常用的特征参数和分类方法,最后探讨说话人识别研究的难点。相似文献

2.

改进后的VQ算法在说话人识别中的应用

罗利张友纯《硅谷》2009,(6)

根据不同环境下不同说话人语音特征各阶差异较大的特点,对矢量量化算法进行改进,提出一种基于动态权值改进的矢量量化(VQ)方法。实验结果证明,该方法提高说话人识别系统的识别率。相似文献

3.

独立分量分析在说话人识别技术中的应用

邱作春曾庆宁《声学技术》2008,27(6):863-866

独立分量分析方法能够将线性混合信号进行分离,得到统计独立的源信号,能用于提取组合语音的特征基函数。倒谱矢量符合ICA变换的假设条件,用ICA方法对MFCC特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。相似文献

4.

Delta特征用于说话人识别的研究

张凯《声学与电子工程》2008,(2):21-24

Delta特征是反映语音信号帧间动态特征的重要特征,本文对LPC和它的Delta特征进行了具体实例求解,并对计算结果进行了分析,探讨了将它用于说话人识别系统的有效性和可行性。相似文献

5.

多通道子空间算法在说话人识别中的应用

下载免费PDF全文

关海欣曾庆宁《声学技术》2008,27(3):396-402

深入研究了基于多通道信号子空间的语音增强算法原理,对算法中各个参数对性能的影响进行了深入剖析．同时给出一种选取噪声方差的简单且有效的方法,并通过研究分析,证明多通道信号子空间算法不仅消噪明显而且对语音的损伤微小,而且相比于单通道子空间语音增强算法除了性能上的提升外,还没有导致计算量的增加。最后将多通道子空间语音增强算法用于说话人识别系统．并与其它多通道语音增强算法（延迟求和波束形成、波束形成后维纳滤波、线性约束最小方差波束形成）进行了对比．实验表明多通道信号子空间语音增强算法在多种噪声环境下均可有效的提高说话人识别系统的识别性能。相似文献

6.

基于子带分析稳健的说话人识别

下载免费PDF全文

关海欣曾庆宁《声学技术》2009,28(2):142-147

针对说话人识别系统易受噪声干扰的问题,考虑语音的非平稳特性,以语音信号各个频段区间所含有信号能量大小和所携带信息量多少的不同为前提假设,以大量的试验为基础,研究语音信号各个子带对噪声的稳健性、所含信息的充分性。研究发现,语音信号的低频区携带大量的说话人个性信息,并且能量集中,不易被噪声干扰,再通过适当地处理,使系统在10dB信噪比下识别率超过90％。相似文献

7.

基于免疫聚类的RBF网络在说话人识别中的应用

下载免费PDF全文

周燕胡志峰《声学技术》2010,29(2):184-187

针对传统的基于RBF（Radial Bais Function）网络的说话人识别系统中聚类中心的数量和位置难以确定的问题,提出了一种基于人工免疫机制的RBF网络作为分类器的说话人识别系统。采用人工免疫机制可根据输入语音数据集合自适应地确定RBF网络隐层中心的数量和初始位置。实际测试表明,该系统具有快速学习网络权重的能力,并且网络的全局寻优能力强,识别率高,是说话人识别的一种有效可行的新方法。相似文献

8.

噪声环境下稳健的说话人识别特征研究

下载免费PDF全文

程小伟王健曾庆宁谢先明龙超《声学技术》2017,36(5):479-483

针对噪声环境下说话人识别率较低的问题,提出一种基于正规化线性预测功率谱的说话人识别特征。首先对语音信号线性预测分析和正规化处理求出语音频谱包络,然后通过伽马通滤波器组得到对数子带能量,最后对特征参数进行离散余弦变换,得到了一种说话人识别特征正规化线性预测伽马通滤波器倒谱系数(Regularized Linear Prediction Gammatone Filter Cepstral Coefficient,RLP-GFCC)。仿真结果表明,在噪声环境说话人辨认试验中,相比传统特征美尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和伽马通滤波器倒谱系数(Gammatone Filter Cepstral Coefficient,GFCC)的系统识别率得到了明显提高,对噪声环境的鲁棒性得到了增强。相似文献

9.

双微阵列语音增强算法在说话人识别中的应用

下载免费PDF全文

毛维曾庆宁龙超《声学技术》2018,37(3):253-260

针对复杂噪声环境下识别性能显著降低的问题,提出一种用于说话人识别系统前端的双微阵列语音增强算法。该算法采用的是相干滤波和频域宽带最小方差无畸变响应波束形成器后置结合改进的维纳滤波器。其基本原理是首先求出双微麦克风阵列信号中两个相邻通道间的相干函数,再利用通道间信号的相干性来进行初始噪声抑制。其次,通过一个频域宽带最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)波束形成器保留目标声源方向的信号并抑制其他方向的信号干扰,再通过改进的维纳滤波器去除噪声残留提升语音质量。最后,使用梅尔频率倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)和伽马通滤波器组频率倒谱系数(Gammatone Filter-bank Frequency Cepstral Coefficients,GFCC)对增强后的语音信号做特征参数提取并进行说话人识别。仿真过程采用声学人工头模拟双耳采集数据,实验结果表明,该语音增强算法在复杂噪声环境下能够获得较好的增强效果,能有效提升说话人识别系统的识别率。相似文献

10.

一种基于确认模式的说话人识别系统

陈涛方志刚徐洁《人类工效学》2008,14(1):42-44

提出基于确认模式的说话人识别系统,在说话人确认的两个过程中均进行了适当的改进,语音预处理中提出了新的端点检测机制,美尔频率倒谱系数(MFCC)提取中进行了倒谱滤波;在模板匹配过程中应用了基于码字转移的改进型矢量量化(VQ-LBG)算法,并应用于确认模式.实验采用将用户的声音数据置于智能(IC)卡中来进行用户确认,结果表明,该模式在大大降低数据量和存储量的同时,极大的提高了身份识别的速度和准确度. 相似文献

11.

基于均值特征和改进深度神经网络的说话人识别算法

下载免费PDF全文

罗春梅张风雷《声学技术》2021,40(4):503-507

为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法.算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信... 相似文献

12.

复合基神经网络在水声目标分类识别中的应用 总被引：5，自引：0，他引：5

下载免费PDF全文

方世良陆佶人《声学技术》1998,17(2):54-56,62

本文根据不同神经网络的分类特点，提出将径向基函数网络和多层感知器网络复合构成复合基网络，用于水声信号的分类识别，试验表明，该网络的分类能力及对未来训练目标的适应性优于ＢＰ网和ＲＢＦ网。相似文献

13.

一种利用主曲线的说话人自适应方法

王晶莹王作英《高技术通讯》2007,17(5):470-473

为了克服噪声对语音识别系统的影响,提出了一种基于主曲线的说话人自适应方法,这种方法可以通过一组主曲线描述所有状态的特征统计信息和码本参数之间的关系,并利用特征统计量在主曲线上的投影更新码本.当有背景噪声存在时,这种方法可以有效修正状态的特征统计信息以减弱或去掉噪声的影响.在863大词汇量连续语音识别数据库上的实验结果证明:这种方法相对于基线以及本征音说话人自适应算法,系统识别性能都有明显的提高. 相似文献

14.

利用动态时间规整方法对说话人识别的实验研究

常国岑刘国军《声学技术》1990,9(2):24-25

动态时间规整方法是一种以动态规整为基础的模式匹配方法，在模式识别特别是语音识别领域中有着广泛的应用。本文介绍将动态时间规整方法应用于说话人识别的方案，实验研究的结果表明，动态时间规整方法应用于说话人识别是行之有效的，而且实验的错误率可以降低到静态时间规整说话人识别实验的错误率的一半。相似文献

15.

极低错误接受率的说话人识别方法研究

姜涛韩纪庆郑铁然张光成《高技术通讯》2011,21(4):386-391

针对一些说话人识别方法在应用中要面对海量的集外数据,其很低的错误接受率也会带来大量识别错误的情况,进行了极低错误接受率的说话人识别技术的研究,以求在保证召回率的前提下,将错误接受率降低至约万分之一的水平.研究的重点是对经典的高斯混合模型-通用背景模型(GMM-UBM)方法进行了改进,加入一个确认判决机制来进一步拒绝集外... 相似文献

16.

EMD-Tnorm得分规整策略在说话人确认中的应用

李燕萍唐振民《中国工程科学》2010,12(2):95-100

从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。相似文献

17.

基于机器视觉的轮毂在线识别分类技术研究

郭智杰王明泉张俊生焦腾云《测试技术学报》2019,33(3)

为了对生产线上的轮毂进行识别分类,本文开发了一套基于OpenCV和MFC平台的轮毂型号在线识别系统.首先提取轮毂的高度、外直径、中心孔直径、辐条数目、幅窗的周长面积比等特征参数.其中,通过图像预处理、边缘检测、圆拟合、系统标定等方法获取轮毂外直径,来表征各类轮毂的尺寸;通过提取辐条数目、中心孔直径、幅窗的周长面积比等具有旋转不变性的常量来表征各类轮毂的形状.然后为提取到的特征参数生成序列号,作为型号识别的特征参数.最后将生成的特征序列号与模板库中的标准数值进行比对,达到在线实时分类的效果.实验结果表明:该系统的识别准确率为98.7%,能够有效地完成轮毂的在线识别分类,为轮毂缺陷检测的自动化、智能化提供了保障. 相似文献

18.

嵌入时延神经网络的高斯混合模型说话人辨认

陈存宝赵力《声学技术》2010,29(3):292-296

提出了一种在高斯混合模型中嵌入时延神经网络的方法。它集成了作为判别性方法的时延神经网络和作为生成性方法的高斯混合模型各自的优点。时延神经网络挖掘了特征向量集的时间信息,并且通过时延网络的变换使需要假设变量独立的最大似然概率（ML）方法更为合理。以最大似然概率为准则,把它们作为一个整体来进行训练。训练过程中,高斯混合模型和神经网络的参数交替更新。实验结果表明,采用所提出的模型在各种信噪比情况下的识别率都比基线系统有所提高,最高能达到21%。相似文献

19.

各种生物特征识别技术助力生活

《中国防伪报道》2011,(2):63-64

目前,随着越来越多的各种身份识别技术正普遍使用,给我们的日常生活带来了变化。汉王"人脸通"正式登陆美国作为"中国创造"开路先锋之一的汉王科技公司日前宣布,旗下代表高科技界高水平的"人脸通"产品正式登陆美国市场。汉王高级副总裁徐冬坚在第二届中国企业海外拓展峰会上的一席主题演讲,又在中国创造全球崛起的"能量池"中激起不小的波澜。相似文献

20.

基于BPSO-KNN算法的被动声呐目标分类识别技术研究

下载免费PDF全文

朱宗斌陶剑锋葛辉良郑佳《声学技术》2019,38(2):219-223

以提取得到的被动声呐目标功率谱特征为基础,采用二进制粒子群(Binary Particle Swarm Optimization, BPSO)优化算法和k最近邻(k-Nearest Neighbor, KNN)分类算法相结合的BPSO-KNN算法进行特征选择和参数优化,分别用KNN分类算法和BPSO-KNN分类算法对实际得到的四类海上被动声呐目标进行分类识别。结果表明,BPSO-KNN算法可对提取的功率谱特征进行特征优化选择,并对KNN分类器进行参数优化,提高了对四类目标的分类精度。该算法在被动声呐目标分类识别方面有参考价值。相似文献