首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   13篇
  一般工业技术   13篇
  2012年   1篇
  2011年   2篇
  2010年   2篇
  2009年   2篇
  2008年   4篇
  2002年   2篇
排序方式: 共有13条查询结果,搜索用时 31 毫秒
1.
多通道子空间算法在说话人识别中的应用   总被引:2,自引:2,他引:0  
关海欣  曾庆宁 《声学技术》2008,27(3):396-402
深入研究了基于多通道信号子空间的语音增强算法原理,对算法中各个参数对性能的影响进行了深入剖析.同时给出一种选取噪声方差的简单且有效的方法,并通过研究分析,证明多通道信号子空间算法不仅消噪明显而且对语音的损伤微小,而且相比于单通道子空间语音增强算法除了性能上的提升外,还没有导致计算量的增加。最后将多通道子空间语音增强算法用于说话人识别系统.并与其它多通道语音增强算法(延迟求和波束形成、波束形成后维纳滤波、线性约束最小方差波束形成)进行了对比.实验表明多通道信号子空间语音增强算法在多种噪声环境下均可有效的提高说话人识别系统的识别性能。  相似文献
2.
独立分量分析在说话人识别技术中的应用   总被引:2,自引:2,他引:0  
邱作春  曾庆宁 《声学技术》2008,27(6):863-866
独立分量分析方法能够将线性混合信号进行分离,得到统计独立的源信号,能用于提取组合语音的特征基函数。倒谱矢量符合ICA变换的假设条件,用ICA方法对MFCC特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。  相似文献
3.
基于长时平均频谱的"文本无关"话者识别   总被引:1,自引:0,他引:1  
王宏  向大威 《声学技术》2002,21(1):59-62
文章在动窗离散傅立叶变换为基础获取说话人的长时平均频谱(即短时频谱的长时平均),然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关”话者识别的语音特征。分析之前,语音样本经过频域预知权和时域汉明窗加权处理,并利用帧能量门限自动去除了样本中的寂静段。通过在小人群范围内对该方法的大量实验,得到很好的话者识别效果。另外,作为“文本无关”话者识别的一个重要辅助手段,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图,它们能清晰地给出话者语音的时变频率特征。  相似文献
4.
基于免疫聚类的RBF网络在说话人识别中的应用   总被引:1,自引:1,他引:0  
周燕  胡志峰 《声学技术》2010,29(2):184-187
针对传统的基于RBF(Radial Bais Function)网络的说话人识别系统中聚类中心的数量和位置难以确定的问题,提出了一种基于人工免疫机制的RBF网络作为分类器的说话人识别系统。采用人工免疫机制可根据输入语音数据集合自适应地确定RBF网络隐层中心的数量和初始位置。实际测试表明,该系统具有快速学习网络权重的能力,并且网络的全局寻优能力强,识别率高,是说话人识别的一种有效可行的新方法。  相似文献
5.
基于子带分析稳健的说话人识别   总被引:1,自引:1,他引:0  
关海欣  曾庆宁 《声学技术》2009,28(2):142-147
针对说话人识别系统易受噪声干扰的问题,考虑语音的非平稳特性,以语音信号各个频段区间所含有信号能量大小和所携带信息量多少的不同为前提假设,以大量的试验为基础,研究语音信号各个子带对噪声的稳健性、所含信息的充分性。研究发现,语音信号的低频区携带大量的说话人个性信息,并且能量集中,不易被噪声干扰,再通过适当地处理,使系统在10dB信噪比下识别率超过90%。  相似文献
6.
文章以动窗离散傅立叶变换为基础获取说话人的长时平均频谱(即短时频谱的长时平均),然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关“话者识别的语音特征.分析之前,语音样本经过频域预加权和时域汉明窗加权处理,并利用帧能量门限自动去除了样本中的寂静段.通过在小人群范围内对该方法的大量实验,得到很好的话者识别效果.另外,作为“文本无关“话者识别的一个重要辅助手段,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图,它们能清晰地给出话者语音的时变频率特征.  相似文献
7.
武光利 《硅谷》2012,(19):179+189-179,189
说话人识别是语音识别的一个重要的分支,是当前的研究热点之一。首先介绍说话人识别的基本原理,然后介绍说话人识别常用的特征参数和分类方法,最后探讨说话人识别研究的难点。  相似文献
8.
针对一些说话人识别方法在应用中要面对海量的集外数据,其很低的错误接受率也会带来大量识别错误的情况,进行了极低错误接受率的说话人识别技术的研究,以求在保证召回率的前提下,将错误接受率降低至约万分之一的水平.研究的重点是对经典的高斯混合模型-通用背景模型(GMM-UBM)方法进行了改进,加入一个确认判决机制来进一步拒绝集外误识,尝试了三种确认方法--基于粗粒度分析窗的方法、基于集外竞争模型的方法、基于变化状态统计矢量的方法.实验结果表明,这三种方法都能够有效降低错误接受率指标,其中基于变化状态统计矢量的方法取得了最好的效果.  相似文献
9.
姚明秋  徐韩  王芳 《硅谷》2011,(21):177-178
分类在说话人识别中的应用对于提高系统响应时间有非常重要的作用,对基频和共振峰进行研究,基频可以用于区分男声和女声,依据共振峰的幅值则可以区分成人和儿童,将这种分类方法应用于说话人识别中可以大大缩短识别时间。  相似文献
10.