期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机工程与科学》2014,(1)

概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。相似文献

2.

基于VQ的说话人识别系统

DING Yan-wei DAI Yu-gang 《数字社区&智能家居》2008,(32)

该文介绍了一种基于矢量量化(VQ)方法的一个说话人识别算法。基于矢量量化的说话人识别,因其运算过程简单等特点,在说话人识别领域有着广泛的应用。用不同语音参数进行实验,实验表明应用矢量量化的方法用在说话人识别中是一种有效方法。相似文献

3.

基于量子隧穿效应的说话人真伪鉴别方法

黄亮潘平周超《计算机应用》2017,37(9):2617-2620

针对语音信号的非结构化特点,提出了一种基于量子隧穿效应的说话人真伪鉴别方法。以量子隧穿效应为理论依据,首先,在分析语音信号分帧的量子特性基础上,将每一帧语音信号看作一个量子态,实现算法的量子化;然后,利用势垒能分离能量的特性,通过构建势垒组以提取信号的能量谱特征,并以此作为特征参数;最后,通过高斯混合模型（GMM）进行语音信号建模,完成说话人的真伪鉴别。仿真结果表明,相对于传统方法,利用量子隧穿效应理论实现说话人鉴别可以有效降低算法的复杂度,提高识别的识别率和可靠性,为量子信息理论和说话人真伪鉴别方法提供了新的研究途径。相似文献

4.

基于段级特征的对话环境下说话人分段算法

王波徐毅琼李弼程《计算机工程与设计》2007,28(10):2401-2402,2416

提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述.该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度. 相似文献

5.

说话人识别中随机局部搜索算法的研究

下载免费PDF全文

蒋皓石杜谋辉林嘉宇《计算机工程与科学》2006,28(7):85-86

目前在矢量量化的码本训练中经典的聚类方法是LBG算法,但该算法的主要缺陷是对初始码书的依赖性较大,容易过早地陷入局部极小.本文在基于矢量量化的说话人识别中研究了一种随机局部搜索的聚类算法.该算法不依赖初始条件,结构规则,容易实现,效果好,具有很优越的全局优化搜索能力,在语音参数聚类实验中表现出了很好的性能,得到的码书质量也优于经典的LBG-算法,从而为在基于矢量量化的说话人识别中设计准全局最优码书提供了一种新思路. 相似文献

6.

一种加权矢量量化的说话人识别技术

LI Na CUI Lian-yan LI Lan-lan 《数字社区&智能家居》2008,(35)

该文研究了在基于矢量量化的说话人识别方法中采用加权的失真测度对识别率的影响。在采用加权欧氏距离失真测度时,利用特征参数的离散程度来确定权值,提出了基于标准差的加权失真测度和基于方差的加权失真测度。实验结果表明,在以MFCC为特征参数的说话人识别系统中,使用这两种算法均可以提高识别率。相似文献

7.

基于改进VQ算法的文本无关的说话人识别 总被引：3，自引：2，他引：3

张庆芳赵鹤鸣《计算机工程与应用》2006,42(10):65-68

基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。相似文献

8.

模糊C-均值聚类新算法在说话人辨认中的应用 总被引：2，自引：0，他引：2

王成儒王金甲《计算机工程与应用》2003,39(27):94-95,140

该文提出了一种将模糊C-均值聚类法的各种改进算法与矢量量化法相结合的说话人辨认的新方法。首先从语音信号中提取MFCC特征矢量,其次利用矢量量化来设计码书,最后用改进算法对待识语音进行辨认。新算法的辨认率达到95%以上,抗噪性能也优于矢量量化法。相似文献

9.

一种基于K-SVD的说话人识别方法

马振张雄伟杨吉斌《计算机工程与应用》2012,48(34):112-115,135

为了充分提取语音中的个人特征信息,类比矢量量化,提出了一种基于K-均值奇异值分解(K-SVD)的说话人识别方法。利用K-SVD训练得到的字典可较好地保存语音信号中的个人特征信息。利用这一特性,通过K-SVD从训练数据中提取包含说话人个人特征信息的字典,利用该字典实现说话人识别。相对于传统方法,该方法能够更好地利用语音的稀疏性保存语音中的个人特征信息并减小重构误差。实验仿真结果表明,与基于矢量量化的说话人识别方法相比,该方法在多说话人的情况下具有更好的识别率,具有更高的实用价值。相似文献

10.

语音识别中的一种说话人聚类算法 总被引：1，自引：1，他引：1

肖述才欧智坚王作英《中文信息学报》2005,19(4):85-89

本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR 距离作为距离测度的时候,该算法对句子的聚类正确率达85169 %;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。相似文献

11.

On the use of nearest feature line for speaker identification 总被引：5，自引：0，他引：5

Ke Chen Ting-Yao Wu Hong-Jiang Zhang 《Pattern recognition letters》2002,23(14):1735-1746

As a new pattern classification method, nearest feature line (NFL) provides an effective way to tackle the sort of pattern recognition problems where only limited data are available for training. In this paper, we explore the use of NFL for speaker identification in terms of limited data and examine how the NFL performs in such a vexing problem of various mismatches between training and test. In order to speed up NFL in decision-making, we propose an alternative method for similarity measure. We have applied the improved NFL to speaker identification of different operating modes. Its text-dependent performance is better than the dynamic time warping (DTW) on the Ti46 corpus, while its computational load is much lower than that of DTW. Moreover, we propose an utterance partitioning strategy used in the NFL for better performance. For the text-independent mode, we employ the NFL to be a new similarity measure in vector quantization (VQ), which causes the VQ to perform better on the KING corpus. Some computational issues on the NFL are also discussed in this paper. 相似文献

12.

说话人识别中基于聚类特征的矢量量化技术

徐利敏唐振民何可可钱博《计算机工程与应用》2007,43(27):196-198

为解决采用矢量量化的方法进行说话人识别时出现的失真问题,根据汉语语音的发音特性,提出了将矢量量化与语音特征的聚类技术相结合的方法,在进行矢量量化码书训练之前,先对特征矢量进行聚类筛选。实验结果表明,当测试语音片段长度为4 s时,在保持95％左右识别率下,采用普通矢量量化方法需64码本数,而采用该文方法只需8码本数,降低了8倍。结果说明该方法不但在一定程度上解决了因训练样本不足而引起的失真问题,而且通过方法的改进,实现了采用较低码字数产生较好的识别结果,从而提高识别效率。相似文献

13.

基于话者特征图案的BPNN话者模型 总被引：1，自引：0，他引：1

方绍武戴蓓倩《计算机学报》2002,25(5):556-560

该文提出了一种用于说话人识别的基于话者特征图案的BPNN话者模型，该话者模型解决了语音信号的时长变化与神经网络输入层结点数固定不变之间的矛盾。利用VQ技术对所有话者的语音样本训练出话者特征图案，再将语音样本对该特征图案进行映射，在映射域解决了语音样本的时间规正问题。同时，该方法还提高了映射域参数的模式分类能力。相似文献

14.

基于LabVlEW的语音身份认证系统

唐夫乾汪亚明郑俊褒《工业控制计算机》2011,24(12):22-23

设计了一套基于LabVIEW的语音身份认证系统,以LabVIEW2009为开发平台,采用改进的美尔倒频谱系数法进行语音信号特征提取,采用矢量量化模型进行语音识别,实现了与文本、性别无关的声纹识别.实验结果表明该系统能够有效克服环境噪声、说话人声音变异带来的影响. 相似文献

15.

语音信息的身份和指令识别方法应用

姬晓飞《计算机系统应用》2013,22(4):186-189

针对智能机器人系统对语音交互功能的实际需求, 在DM-B200开放式机器人平台上,设计并实现了基于语音信息的说话人身份识别功能和语音指令识别功能. 为了准确识别特定说话人的身份, 采用了矢量量化的识别方法, 而为了提高机器人语音控制的实时性, 语音指令识别采用了动态时间规整的方法. 应用结果表明, 所设计的语音识别系统达到96%以上的综合识别率, 具有实际应用价值. 相似文献

16.

基于群模型改进的说话人确认系统

刘晓燕傅鹂周元《计算机应用与软件》2007,24(11):150-151,203

在研究说话人识别系统时,分别从特征参数的选取和识别训练两种不同角度分析了加权特征向量和群模型在增强系统性能方面的可行性,并采用群模型与加权特征向量相结合的方式建立与文本无关的说话人确认系统.试验结果表明,含加权特征向量的群模型比传统的矢量量化有更高的辨识率,而且错误拒绝率在一定的错误接受率下也有显著降低. 相似文献

17.

基于模糊C均值聚类的一种说话人识别方法的改进

孙德一崔连延《数字社区&智能家居》2007,3(16):1104-1105

模式匹配在整个说话人识别系统中具有重要的作用,其采取的方法将直接影响系统的识别率.本文介绍了一种模糊矢量量化(FVQ)方法,通过对模糊C均值(FCM)聚类算法的分析,提出了基于减法聚类和改进的模糊C均值聚类算法相结合的说话人识别方法,实验表明该方法提高了识别率,是一种行之有效的说话人识别方法. 相似文献

18.

基于DSP的声控系统的设计与实现 总被引：3，自引：0，他引：3

马洪连朱杰杨凤岐孟新雨《测控技术》2005,24(12):30-32

介绍了一个包括说话人识别和说话内容识别的声控系统的设计与实现.该系统以TMS320VC5509 DSP为平台,以倒谱系数为特征参数,以欧氏距离法和矢量量化法为识别算法,实时实现了系统的识别功能. 相似文献

19.

Comparison of clustering methods: A case study of text-independent speaker modeling

Tomi Kinnunen Ilja Sidoroff Marko Tuononen Pasi Fränti 《Pattern recognition letters》2011,32(13):1604-1617

Clustering is needed in various applications such as biometric person authentication, speech coding and recognition, image compression and information retrieval. Hundreds of clustering methods have been proposed for the task in various fields but, surprisingly, there are few extensive studies actually comparing them. An important question is how much the choice of a clustering method matters for the final pattern recognition application. Our goal is to provide a thorough experimental comparison of clustering methods for text-independent speaker verification. We consider parametric Gaussian mixture model (GMM) and non-parametric vector quantization (VQ) model using the best known clustering algorithms including iterative (K-means, random swap, expectation-maximization), hierarchical (pairwise nearest neighbor, split, split-and-merge), evolutionary (genetic algorithm), neural (self-organizing map) and fuzzy (fuzzy C-means) approaches. We study recognition accuracy, processing time, clustering validity, and correlation of clustering quality and recognition accuracy. Experiments from these complementary observations indicate clustering is not a critical task in speaker recognition and the choice of the algorithm should be based on computational complexity and simplicity of the implementation. This is mainly because of three reasons: the data is not clustered, large models are used and only the best algorithms are considered. For low-order models, choice of the algorithm, however, can have a significant effect. 相似文献