共查询到18条相似文献,搜索用时 62 毫秒
1.
2.
本文提出了一种新的说话人特征分类方法,基于计算动词相似度理论,建立距离和趋势的评价模型,通过计算特征向量与k-means算法聚类所得的聚类中心的相似度矩阵,将说话人个性特征从MFCC特征域映射到说话人相似度属性空间中,形成新的特征向量集,这样,每个说话人的特征向量将被聚为在距离和变化趋势上最具相似性的k分类。之后,利用GMM模型在属性空间内进行联合概率分析、匹配,建立新的说话人识别系统。本文采用标准TIMIT语音库与NIST语音库在该识别系统中进行一系列实验,结果表明,该基于新的优化特征分类的识别系统,对比传统的说话人识别系统,在等错误率上有很好的提高。 相似文献
3.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。 相似文献
4.
为了解决传统高斯混合模型(Gaussian Mixture Model,GMM)对初值敏感,在实际训练中极易得到局部最优参数的问题,本文提出了一种GMM参数优化的新方法.将小生境技术与最大似然估计融入到遗传训练过程,形成了一种新的混合算法,缓解了遗传算法产生的"早熟"现象,提高了算法的局部搜索能力.采用自适应策略来控制交叉和变异算子,同时在适应度评价中融入了其他用户的区分性信息,提高了模型的分类精度,增强了GMM的泛化能力.实验表明,与传统和改进的两种方法相比,本文的方法都可以得到更优的模型参数,使得系统的识别率进一步提高. 相似文献
5.
6.
基于相似度的双搜索多目标识别算法 总被引:3,自引:2,他引:3
在分析远距离多目标特性的基础上,提出了一种基于相似度的粗精双搜索多目标识别算法。在粗搜索阶段,首先利用圆形形态学模板在滤波后的二值化图像中快速搜索候选目标,再利用“距离相似度”原则进行候选目标的聚类分析,以同一目标内各候选目标点的形心位置作为局部熵处理区域中心。在精搜索阶段,以最大熵值点为种子点进行目标区域生长。为了减少运算量,提高实时性,还采用基于熵相似度、简单连接法与子区合并法相结合的改进型区域生长法,重构单个目标。仿真结果表明该算法可快速、准确地实现对5个目标的识别。 相似文献
7.
由于传统的压缩算法,在数据智能自适应压缩时没有对相似度分段距离进行计算,因此压缩比低,无法实现数据智能自适应压缩。为此提出基于相似度分段的数据智能自适应压缩算法研究。通过相似度分段距离计算,判定基准数据是否发生变化,如发生变化则记录此1/4周期数据,并替换基准数据;采用串表压缩,根据相似度分段距离,在编码中定义数据字符、字串、前缀以及后缀等压缩概念;计算基于相似度分段的自适应压缩特征值,解决数据量化误差大的问题;通过自适应压缩噪声补偿,完成数据智能自适应压缩。设计对比实验,结果表明,设计的压缩算法在3个数据集中压缩比均明显高于对照组,验证了设计压缩算法在数据智能自适应压缩中的可行性。 相似文献
8.
基于结构相似度的自适应图像质量评价 总被引:3,自引:7,他引:3
考虑到在结构相似度(SSIM,structural similarity)模型中,亮度、对比度和结构度3个评价因子对不同失真类型图像质量评价(QA)的贡献程度不同,本文提出了根据图像失真类型分析的自适应SSIM(ASSIM)的IQA方法。首先,分析失真图像和参考图像的小波子带能量、傅里叶功率谱和幅度谱的数据特点,据此判定图像失真类型,包括高斯白噪声(WN)、JPEG压缩(JPEM)、高斯模糊(Gblur)及类JP2K4类失真;接着,通过优化算法确定SSIM在评价不同失真类型图像时最佳的评价因子权重;最后,将图像的失真类型判别和评价因子的调整相结合,实现对图像的自适应评价。实验结果表明,由于失真类型的判断和评价因子权值的优化,ASSIM对各类失真图像的评价效果都要优于SSIM,特别是对Gblur失真的图像进行评价时,Pearson系数(CC)值提高了0.05,Spearman等级相关系数(SROCC)值的提高超过0.039。 相似文献
9.
该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人相关模型限制在这组基矢量所张成的说话人子空间中,通过求解每一个基矢量对应的系数从而进行说话人自适应。与经典的基于子空间的说话人自适应方法不同,该文中的说话人子空间是在自适应阶段动态选取的,所需要估计的参数更少,在少量自适应数据下可以得到更稳健的自适应结果。在基于微软语料库的连续语音识别自适应实验中,给定极少量自适应数据(小于5 s),在有监督和无监督条件下,该文方法均优于经典的本征音自适应方法和基于最大似然线性回归的方法。 相似文献
10.
滤波器的相似度及其在基于分析-合成语音编码中的应用 总被引:2,自引:0,他引:2
本文提出了一种关于滤波器间相似性度的定义及计算相似度的方法.并将其应用于基于分析-合成(Analysis-by-Synthesis)的线性预测编码中,可以在对再生语音质量影响较小的情况下,大大降低编码的码率. 相似文献
11.
循环相关匹配滤波器设计 总被引:10,自引:0,他引:10
在谱相关分析的基础上,讨论了对循环平稳信号进行最佳滤波的问题,推导得到了基于最大输出信噪比准则的循环相关匹配滤波器的解析表式.然而,由于该滤波器性能与所选取的循环频率是相关的,单循环频率循环相关匹配滤波器存在固有的缺陷-信号能量利用不充分.为此,研究了多循环频率循环相关匹配滤波器组的设计方法,在最大输出信噪比准则约束下确定了滤波器组的优化结构.仿真实验比较了谱相关分析方法和循环相关匹配滤波方法,对调幅信号和BPSK信号的仿真实验结果证实了文章理论分析得到的结果. 相似文献
12.
13.
基于码本的说话人自适应方法 总被引:1,自引:0,他引:1
本文提出了一种基于码本的说话人自适应方法.它可以将变换方法和Bayes估计法这两大类说话人自适应方法的优点有机的结合起来,既能实现快速的说话人自适应,还具有良好的一致渐进性.自适应过程可分为两个阶段:在第一阶段,用由大量参考说话人的语音码本构成的线性组合来逼近用户的语音码本.此时只需要很少的自适应训练数据就可以用基于Rosen梯度投影法的优化算法计算出线性组合中各码本的最佳权值.在第二阶段,码本的最佳线性组合被用作用户码本的先验估计值.随着更多自适应训练数据的获得,系统对用户码本进一步进行Bayes估计,从而可以实现累进的自适应.作者将该方法应用于说话人无关的连续汉语语音识别系统.一系列的对比实验表明该自适应方法很有前途. 相似文献
14.
15.
本文在基于GMM的与文本无关说话人识别系统中考虑性别差异,提出了把不同性别的说话人特征参数归成不同的两个子集,识别时先判断待识别说话人特征是属于哪个性别子集后,再在相应的子集中进行识别的方法。实验结果表明该方法能够改善基于GMM的与文本无关说话人识别系统的识别率。 相似文献
16.
汉语大词汇量连续语音识别系统研究进展 总被引:34,自引:3,他引:34
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 相似文献
17.