首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
孙念  张毅  林海波  黄超 《计算机应用》2018,38(10):2839-2843
当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语音信号里缺乏充分的说话人信息,使得说话人识别性能急剧下降。针对短语音条件下的说话人信息不足的问题,提出一种基于多特征i-vector的短语音说话人识别算法。该算法首先提取不同的声学特征向量组合成一个高维特征向量,然后利用主成分分析(PCA)去除高维特征向量的相关性,使特征之间正交化,最后采用线性判别分析(LDA)挑选出最具区分性的特征,并且在一定程度上降低空间维度,从而实现更好的说话人识别性能。结合TIMIT语料库进行实验,同一时长的短语音(2 s)条件下,所提算法比基于i-vector的单一的梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)、感知对数面积比系数(PLAR)特征系统在等错误率(EER)上分别有相对72.16%、69.47%和73.62%的下降。不同时长的短语音条件下,所提算法比基于i-vector的单一特征系统在EER和检测代价函数(DCF)上大致都有50%的降低。基于以上两种实验的结果充分表明了所提算法在短语音说话人识别系统中可以充分提取说话人的个性信息,有利地提高说话人识别性能。  相似文献   

2.
黄亮  潘平  周超 《计算机应用》2017,37(9):2617-2620
针对语音信号的非结构化特点,提出了一种基于量子隧穿效应的说话人真伪鉴别方法。以量子隧穿效应为理论依据,首先,在分析语音信号分帧的量子特性基础上,将每一帧语音信号看作一个量子态,实现算法的量子化;然后,利用势垒能分离能量的特性,通过构建势垒组以提取信号的能量谱特征,并以此作为特征参数;最后,通过高斯混合模型(GMM)进行语音信号建模,完成说话人的真伪鉴别。仿真结果表明,相对于传统方法,利用量子隧穿效应理论实现说话人鉴别可以有效降低算法的复杂度,提高识别的识别率和可靠性,为量子信息理论和说话人真伪鉴别方法提供了新的研究途径。  相似文献   

3.
为了提高低信噪比下说话人识别系统的性能,提出一种Gammatone滤波器组与改进谱减法的语音增强相结合的说话人识别算法。将改进的谱减法作为预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对增强后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别算法中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种算法应用于说话人识别系统,系统的识别率及鲁棒性都有明显的提高。  相似文献   

4.
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。  相似文献   

5.
杜晓青  于凤芹 《计算机工程》2013,(11):197-199,204
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱一感知线性预测倒谱系数(RASTA—PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。  相似文献   

6.
在语音信号处理中常用麦克风采集语音,然后用算法进行提取和分离,目前常用的有独立分量分析(Independent component Analysis,ICA)算法。但是当麦克风个数少于说话人的个数时,即欠定情形,此时语音信号的提取需采用过完备ICA算法。提出了一种基于过完备ICA算法的两步算法:估计混合矩阵的几何算法和估计源矩阵的最短路径法。该算法能在欠定情形下对语音信号的提取有很好的作用,仿真实验验证了这一结果。  相似文献   

7.
针对许多基于训练模型的计算机听觉场景分析系统,在解决双说话人混合语音信号分离时需要依赖样本训练的有效性以及说话人的先验知识,提出一种基于聚类的单声道混合语音分离系统。系统先利用多基音跟踪算法对语音信号进行分析并产生同时流,然后通过最大化类内散布矩阵与类间散布矩阵的迹,搜索同时流的最佳分类,最终完成对双说话人的语音分离。该系统不需要训练语音模型,并且有效地改善了在双说话人混合语音信号的分离效果,为双说话人的语音分离提供了新的思路。  相似文献   

8.
说话人识别是根据检测到的语音进行说话人身份的认证.是将待识别语音与数据库中的说话人语音进行匹配的过程。设计基于高斯混合模型(GMM)说话人识别系统,提取输入语音的Mel倒谱系数作为观察向量,用GMM算法进行说话人语音模型训练和识别。同时设计基于TMS320DM3730DSP的嵌入式硬件平台,并在该平台上实现所设计的说话人识别系统。为进行性能测试,自行录制相应的语音材料库,录音的人数为38人,其中男19人,女19人。经测试表明,在正常环境下.该设计的说话人系统识别率可达到95%以上。  相似文献   

9.
一种适用于说话人识别的改进Mel滤波器   总被引:1,自引:0,他引:1  
项要杰  杨俊安  李晋徽  陆俊 《计算机工程》2013,(11):214-217,222
Mel倒谱系数(MFcc)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。  相似文献   

10.
语音信号是一种典型的非平稳信号。为了分析语音的非平稳特性,提出一种基于经验模态分解(EMD)与递推最小二乘算法(RLS)自适应滤波器相结合的语音信号去噪预处理器,进一步提高语音信号的信噪比和可懂度。再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。  相似文献   

11.
在连续语音识别中,N-best有很多应用。本论文分析了常用的N-best搜索算法,如并行算法,串行算法,以及Tree-Trellis搜索在搜索过程中的问题后,指出Tree-Trellis搜索的有效性,并且针对Tree-Trellis搜索后向得分计算复杂的问题,提出了一种实现方便的方法,从而快速有效的输出N个有效路径。  相似文献   

12.
本文给出的扩张矩阵合并问题是NP困难问题的一种新的证明。由此得到了析取式最小问题是NP困难问题的新的证明。之后给出了两个扩张矩阵合并的完备策略,在此基础上给出了扩张矩阵合并的启发函数策略,最后提出了一种新的示例学习算法--基于扩张矩阵的启发函数学习算法。  相似文献   

13.
并行处理的研究在数据挖掘中是十分必要的。在理论分析的基础上,提出在对经典串行PAM算法进行并行时应如何从局部聚类信息生成完备的全局聚类信息,据此提出了算法DPAM,在提高计算性能的同时,使聚类质量等价于相应串行PAM算法。为提高并行算法的执行效率,还介绍了如何减小计算结点间通信的代价。最后对提出的算法进行性能分析和实验,说明该算法是高效可行的。  相似文献   

14.
算法是一种被广泛使用的尢线定位算法.定位节点根据接收到的参考坐标值与对应的RSSI值进行计算得出自身坐标.区别于平面定位,提出了三种基于RSSI测距的三维定位算法.第一种与第二种算法运用矩阵求解二元二次方程组得出定位节点坐标,第三种方法为最小二乘法.并且,给出了一种关于RSSI值的均值估计滤波法.最后给出三种算法仿真定...  相似文献   

15.
A hybrid clustering procedure for concentric and chain-like clusters   总被引:1,自引:0,他引:1  
K-means algorithm is a well known nonhierarchical method for clustering data. The most important limitations of this algorithm are that: (1) it gives final clusters on the basis of the cluster centroids or the seed points chosen initially, and (2) it is appropriate for data sets having fairly isotropic clusters. But this algorithm has the advantage of low computation and storage requirements. On the other hand, hierarchical agglomerative clustering algorithm, which can cluster nonisotropic (chain-like and concentric) clusters, requires high storage and computation requirements. This paper suggests a new method for selecting the initial seed points, so that theK-means algorithm gives the same results for any input data order. This paper also describes a hybrid clustering algorithm, based on the concepts of multilevel theory, which is nonhierarchical at the first level and hierarchical from second level onwards, to cluster data sets having (i) chain-like clusters and (ii) concentric clusters. It is observed that this hybrid clustering algorithm gives the same results as the hierarchical clustering algorithm, with less computation and storage requirements.  相似文献   

16.
基于一种改进遗传模拟退火算法的TSP求解   总被引:6,自引:1,他引:5  
快速收敛于全局最优解是遗传算法的一个研究重点.在对遗传算法和模拟退火算法研究的基础上,分析了两种算法各自的优缺点,对已有的遗传模拟退火算法进行了改进.结合遗传算法和模拟退火算法的优点,给出了一种并行的多层搜索结构,提高了算法的效率;同时,在此基础上,提出一种种群早熟评价指标.最后,将此改进算法应用到旅行商问题中,并分别对10个城市和30个城市的旅行商问题进行了仿真,用于验证算法的可行性和快速性.仿真结果表明.改进的遗传模拟退火算法能够较快的收敛于全局最优解.  相似文献   

17.
Masao Iri  Hiroshi Imai 《Algorithmica》1986,1(1-4):455-482
A simple Newton-like descent algorithm for linear programming is proposed together with results of preliminary computational experiments on small- and medium-size problems. The proposed algorithm gives local superlinear convergence to the optimum and, experimentally, shows global linear convergence. It is similar to Karmarkar's algorithm in that it is an interior feasible direction method and self-correcting, while it is quite different from Karmarkar's in that it gives superlinear convergence and that no artificial extra constraint is introduced nor is protective geometry needed, but only affine geometry suffices.  相似文献   

18.
徐岩  李桂苓  刘昱  郭映 《计算机工程》2006,32(24):211-212
研究视频转换编码中的压缩域运动补偿技术,对已有算法加以补充和完善,解决了现有算法不能处理运动矢量为负的问题。从具体实现角度,给出了详细的算法和必要的分析。实验结果表明基于该文所述的算法和分析改造的MPEG-2 TM5解码程序可以正确地实现压缩域运动补偿和空间分辨率下变换。  相似文献   

19.
运用模糊集理论,对基于属性的模糊聚类从概念、原理、算法等方面做了深入的论述,最后给出了一个应用实例,实践证明该算法是有效的。  相似文献   

20.
覆盖和连通是无线传感器网络中两个密切相关的基本问题,直接影响着网络性能和网络任务完成的质量。文章给出了传感器节点的感知模型,从不同角度对覆盖问题进行了分类,阐述了覆盖控制算法的评价指标,介绍了覆盖问题和连通问题的典型算法,最后对覆盖和连通问题的研究方向进行了展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号