共查询到19条相似文献,搜索用时 109 毫秒
1.
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一,它的主要问题是码本设计问题。语音特征参数是高维数据,样本分布复杂,因此码本设计的难度也很大,传统的LBG算法只能获得局部最优的码本。提出一种VQ码本设计的新方法,将小生境技术与K-均值算法融入到免疫算法训练过程中,形成混合免疫算法,采用针对高维数据聚类的改进变异算子,降低了随机变异的盲目性,增强群体的全局及局部搜索能力,同时通过接种疫苗提高算法的收敛速度。说话人识别实验表明,与传统LBG和基于混合遗传算法的VQ码本设计方法相比,该方法可以得到更优的模型参数,使得系统的识别率进一步提高。 相似文献
2.
3.
VQ/HMM二级音节识别的研究 总被引:1,自引:0,他引:1
HMM技术在语音识别是得到较为成功的应用,然而VQ/HMM对在词表的识别速度及识别率仍不理想,文中根据系统实现中的实时性和识别率的要求,提出了初始码本均匀法,对参加训练的各音先对其求平均,然后用各音的平均值组成初始矢量的空间,并采用码本快速迭代法以及标号直方图法与HMM识别相结合的二级识别方法,提高了系统的识别率和识别速度,此方法简单,易于实时化。 相似文献
4.
本文对神经网络语音识别中的语音特征提取、网络结构以及学习算法进行了初步的研究,提出了一种用于时特征矢量量化的简化和改进的自组织神经网络模型VQNN。VQNN中引入了动态规划法估计语音样本矢量的码本类中心初值并确定网络的初始权矩阵,可构造出256个量化等级的码本矢量。该方法具有较强的鲁棒性且矢量量化过程简单迅速。对28个地名的语音量化识别实验结果表明了这种量化方法对时识别的有性。 相似文献
5.
姜天辰 《计算机工程与应用》1998,34(5):24-25
本文讨论了用矢量量化/隐马尔可夫模型(VQ/HMM)法实现的语音识别系统,重点阐述了如何利用HMM对多训练序列的迭代公式使系统具有自学习功能。经实测证明,该系统基本达到了预期性能。 相似文献
6.
本文在简单介绍三种词组语音识别模型后,提出了采用离散隐马尔柯夫模型(DHMM)来构建语音识别系统,并在此基础上引入矢量量化(VQ)模块来保证识别率和识别速度,具有良好的实用性 相似文献
7.
语音识别中基于SFCM模糊聚类的矢量量化方法 总被引:4,自引:1,他引:3
模糊聚类分析算法用隶属度确定样本所属类别,因其良好的效果而被广泛用于语音识别领域。文中提出了一种模糊聚类分析算法SFCM,并将其用于语音特征的矢量量化,最终形成码本尺寸为128的码本,用SFCM算法得到的码本分布合理,没有空类。采用此码本的误音识别实验表明了这种量化方法对语音识别的有效性。 相似文献
8.
基于VQ/CDHMM的噪声环境下汉语口令识别研究 总被引:2,自引:0,他引:2
该文研究了基于改进VQ/HMM模型的语音识别方法,设计实现了基于该模型的汉语口令识别系统;研究了鲁棒性特征参数问题,提出了一些新的基于MFCC和LPCC的高维动态参数;分别进行了纯净语音和不同信噪比语音的识别实验,分析比较了不同类型特征参数、训练状态数和高斯混合度对该系统识别性能的影响。在此基础上得出了以下结论:在加性白噪声的情况下,使用高维动态参数明显提高了系统的鲁棒性;在汉语两字组的短语音(口令)识别中,状态数取4,混合度取3时实验结果较好;利用不同特征参数的优势,进行信息融合,是提高系统性能的一个很好选择。 相似文献
9.
11.
为有效提高语音情感识别系统的识别率,研究分析了一种改进型的支持向量机(SVM)算法。该算法首先利用遗传算法对SVM参数惩罚因子和核函数中参数进行优化,然后用优化后的参数进行语音情感的建模与识别。在柏林数据集上进行7种和常用5种情感识别实验,取得了91.03%和96.59%的识别率,在汉语情感数据集上,取得了97.67%的识别率。实验结果表明该算法能够有效识别语音情感。 相似文献
12.
基于遗传算法和支持向量机的玉米品种识别 总被引:5,自引:0,他引:5
提出了一种基于遗传算法(GA)和支持向量机(SVM)的玉米种子的图像特征选择和分类识别的新方法。该方法首先用遗传算法对采集到的玉米种子图像的特征进行优化,而后采用决策二叉树的支持向量机分类算法对玉米品种进行识别。该分类算法将分类器分布在各个结点上,构成多类支持向量机,减少了分类器的数量和重复训练样本的数量。实验结果表明该方法能选出适合于识别的玉米种子特征并能对玉米种子进行正确地识别。 相似文献
13.
针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将多分支融合为单分支,以降低计算复杂度、加快模型推理速度。然后,利用基于压缩和激励网络的通道注意力机制弥补缺失的通道特征信息,以提高语音识别准确率。最后,在公开数据集Aishell-1上的实验结果表明:相较于Conformer,所提出方法的字错误率降低了10.67%,验证了方法的先进性。此外,RepVGG-SE声学输入网络能够有效提高多种Transformer变体的端到端语音识别模型整体性能,具有很好的泛化能力。 相似文献
14.
针对多光谱图像数据维数高,数据量大的特点,鉴于自适应遗传算法在搜索最优解上特有的优点,提出了采用自适应遗传算法进行白细胞的特征提取,同时为了增强算法的稳定性,提高收敛速度,部分改进了原算法。在此基础上,利用选取的53个特征和二值支持向量机相结合,构造分类器,有效地解决了白细胞的分类识别问题。实验结果表明,改进后的算法具有更快的收敛速度,更好的稳定性,设计的分类器有效地提高了识别速度和精度,识别率达89.02%。 相似文献
15.
针对语音识别系统对实时性和便携性的要求,提出一种基于MFCC/SVM在DM6446嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统,将有向无环图多类分类支持向量机算法移植到该平台。并在该平台用DAG方法对非特定人孤立词和连接词进行语音识别,比隐马尔可夫模型有明显优势。通过样本预选取算法对训练样本进行预选取处理,并且应用到嵌入式语音识别系统中,大大降低了训练时间和测试时间。 相似文献
16.
17.
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 相似文献
18.