共查询到10条相似文献,搜索用时 31 毫秒
1.
采用掌上电脑录音的语音数据库,研究与文本无关的说话人识别,通过引入一种基于高斯混合模型和假设检验方法的新算法,有效提高说话人确认系统的性能.实验结果表明,以假设检验分析为基础的识别算法比传统的使用假冒说话人背景集标准化法的识别算法更加有效,可以同时获得低错误拒绝率(FRR)和低错误接受率(FAR),是一种适合于用掌上电脑录音的语音数据的方法. 相似文献
2.
基于分类高斯混合模型和神经网络融合的与文本无关的说话人识别 总被引:1,自引:0,他引:1
本文提出了一种基于分类高斯混合模型和神经网络融合的说话人识别系统,根据能量阈值将每个话者语音的语音帧分为两类,在分类子空间分别为每个话者建立两个分类话者模型(GMM),并为每个话者建立一个用于对这两类模型进行数据融合的神经网络,话者识别的结果是经对各个话者神经网络的输出进行判决后做出的.在100个男性话者的与文本无关的说话人识别实验中,基于分类话者模型的策略在识别性能和噪声鲁棒性上均优于传统的GMM话者识别系统,而采用神经网络进行后端融合的策略又优于直接融合的策略,从而可以用较低的话者模型混合度和较短的测试语音获得较好的识别性能及噪声鲁棒性. 相似文献
3.
《计算机科学与探索》2016,(9):1320-1331
海量网络信息的出现,使得提取文本信息情感观点成为研究的热点。针对文本情感分类中文本信息模糊及分类准确率低的问题,提出了一种基于Mixed-Fisher特征选择的文本云向量模型聚类算法。该算法首先分别计算文档中各个词性特征项的Fisher判别比,根据Fisher判别比越大特征向量判别性越强的Fisher准则,选择Fisher比值较大的前q个特征,并按照词性进行组合生成文档的Mixed-Fisher特征向量。然后在Mixed-Fisher特征向量集上构建文档的云向量模型,根据云向量模型间的差异度对模型进行聚类和合并。将该算法应用于文本情感观点的分类,选择核Fisher判别技术用于最终文本观点的判定。仿真实验结果表明,基于Mixed-Fisher特征的云向量聚类模型的分类准确率明显优于传统向量空间模型,从而验证了核Fisher判别技术的有效性。 相似文献
4.
在人机语音交互系统中,机器不仅要具有理解人类语音的能力,还应当具有识别说话人情感的能力.本文提出了基于高斯混合模型(GMM)的序列分类和识别的改进方法,并将该方法引入到语音情感识别的研究中.本文提出了观测值次序均衡的方法.实验结果证明这种新的方法有效地提高了语音情感识别的准确率. 相似文献
5.
给出了基于公共码书的说话人分布特征的定义。提出了基于分布特征统计的说话人识别算法,根据所有参考说话人的训练语音建立公共码书,实现对语音特征空间的分类,统计各参考说话人训练语音的在公共码字上的分布特征进行建模。识别中引入双序列比对方法进行识别语音的分布特征统计与参考说话人模型间的相似度匹配,实现对说话人的辨认。实验表明,该方法保证识别率的情况下,进一步提高了基于VQ的说话人识别的速度。 相似文献
6.
7.
提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述.该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度. 相似文献
8.
为提高构音障碍识别准确率,提出一种基于多特征组合的构音障碍语音识别方法。利用遗传算法进行特征选择,从语音的韵律特征、频谱特征、人耳听觉特征、嗓音质量特征和声道模型特征等5类特征组合成的多特征组合中选择出分类准确率最高的特征子集,通过SVM分类器对选择出的特征进行识别。在Torgo声学和发音数据库对不同的语音刺激类型进行模拟实验,实验结果表明,提出方法对Torgo数据库的3种语音刺激类型的平均准确率为97.52%,优于现有的识别方法。 相似文献
9.
10.
常用的文本无关的说话人识别系统中,高斯混合模型是一种常用的有效模型,其在常用的说话人识别系统中具有很广泛的应用,但是典型的GMM模型的识别时间较长,其识别性能尚待提高。为了进一步提高说话人识别系统的性能,综合语音数据的分布特性和log10(.)函数曲线的分布特性提出了一种有效特征集的选择方法,实验结果证明了提出的选择算法的有效性。 相似文献