首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 390 毫秒
1.
陈倩 《计算机科学》2012,39(7):280-281,286
矢量量化在图像压缩中有着举足轻重的地位。码书的设计是算法的关键,经典的LBG聚类算法由于对初始码书的选择非常敏感会导致不同的量化效果。把遗传算法和LBG算法相结合,充分利用LBG算法的局部搜索能力和遗传算法的全局寻优能力,能够在大大改善码本质量的同时加快算法的收敛速度。  相似文献   

2.
基于改进VQ算法的文本无关的说话人识别   总被引:3,自引:2,他引:3  
基于矢量量化的说话人识别,因其运算过程简单等特点,在文本无关的说话人识别领域有着广泛的应用。论文根据说话人识别中训练语音的特点并结合快速搜索算法,对矢量量化的码书形成算法进行了改进,提出了一种基于改进算法的与文本无关的说话人识别方法。经实验结果证明,论文的方法加快了码书的形成,减少了码书形成的计算量,改善了码本的性能,提高了说话人识别的识别率。  相似文献   

3.
在矢量量化的码书设计过程中,针对传统的LBG算法对初始码书选取的依赖性及易陷入局部最优的缺陷,提出基于免疫猫群优化算法的矢量量化码书设计.将整个种群分为搜索组和跟踪组,运用克隆扩增算子在搜寻组中进行局部搜索,根据适应度值大小调节变异个体数目,保持解的多样性.运用动态疫苗提取与接种算子使跟踪组个体基因与疫苗进行交叉变异,向最优解靠拢,防止无监督交叉变异可能引起的退化现象.通过浓度平衡算子和选择算子更新子代种群,防止种群"早熟".将训练出全局最优码书输入到HMM模型进行训练和识别,实验结果表明,基于免疫猫群优化算法的矢量量化码书设计不依赖于初始码书选取,鲁棒性强且降低语音识别误差率.  相似文献   

4.
提出了一种高效的矢量量化码书设计算法.首先采用主分量分析对训练矢量排序以减少计算复杂度,然后充分利用遗传算法的全局优化能力计算得到接近全局最优的矢量量化码书.实验结果表明:该算法的计算时间少于经典的LBG算法,而且当码书大小不超过64时,所生成的码书性能比LBG算法有明显提高.  相似文献   

5.
基于量子模距离的说话人识别方法   总被引:1,自引:0,他引:1  
概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。  相似文献   

6.
概率测度和距离测度是模式识别最基本的两种测度,矢量量化算法是典型的基于距离测度的模式识别算法。根据量子模距离测度理论,在矢量量化算法的基础上,探索一种基于量子模距离的说话人识别方法。该方法针对说话人语音的时变性、随机性、特征维数较高等特点,将一帧语音信号视为一个量子态,并根据量子测量理论,对量子态之间进行模距离测量,从而对量子态进行有效的分类和聚类。研究表明该方法能有效地降低语音信号处理的复杂度。在经典计算机上的仿真表明,该方法在运行时间上略优于矢量量化算法,在识别率上明显优于矢量量化算法,为说话人识别的理论研究提供了新的途径。  相似文献   

7.
模糊C-均值聚类新算法在说话人辨认中的应用   总被引:2,自引:0,他引:2  
该文提出了一种将模糊C-均值聚类法的各种改进算法与矢量量化法相结合的说话人辨认的新方法。首先从语音信号中提取MFCC特征矢量,其次利用矢量量化来设计码书,最后用改进算法对待识语音进行辨认。新算法的辨认率达到95%以上,抗噪性能也优于矢量量化法。  相似文献   

8.
许允喜  俞一彪 《计算机应用》2008,28(2):339-341,
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一,它的主要问题是码本设计问题。语音特征参数是高维数据,样本分布复杂,因此码本设计的难度也很大,传统的LBG算法只能获得局部最优的码本。提出一种VQ码本设计的新方法,将小生境技术与K-均值算法融入到免疫算法训练过程中,形成混合免疫算法,采用针对高维数据聚类的改进变异算子,降低了随机变异的盲目性,增强群体的全局及局部搜索能力,同时通过接种疫苗提高算法的收敛速度。说话人识别实验表明,与传统LBG和基于混合遗传算法的VQ码本设计方法相比,该方法可以得到更优的模型参数,使得系统的识别率进一步提高。  相似文献   

9.
李庆忠  蒋萍  褚东升 《计算机工程》2007,33(20):219-221
提出了一种基于DCT变换的矢量自适应分类的全局矢量量化编码算法。为降低码矢的维数和计算复杂度,提高搜索速度和压缩比,将变换的DCT矢量自适应分类为平滑类、边缘类和纹理类,根据矢量的类别构造不同长度的变换矢量和根据矢量的类别分别采用改进的全局矢量量化算法进行相应的码书设计。为提高光照变化时相邻帧间矢量运动补偿的匹配率,在矢量构造中将DC系数单独进行编码。实验结果表明:该算法在信噪比和压缩比方面具有良好的视频压缩性能,比较适合于智能视频监控系统以及水下视频等光照随时间有较大变化的场合。  相似文献   

10.
张绪冰  关泽群  徐景中 《计算机应用》2007,27(12):3051-3054
鉴于经典的LBG码书设计算法易陷入局部最优解,首次采用粒子群优化算法来设计图像矢量量化的最优码书,并提出了粒子群矢量量化(PSO-VQ)算法和粒子一致性操作(PCO)。在PSO-VQ算法中,每个粒子表示一个码书,以粒子群进化的方式对初始码书进行迭代而获得最优码书,PCO操作对各初始码书中的码矢量按其灰度均值排序,使不同码书的内部结构基于码矢量灰度均值达到基本一致,确保了结果向全局最优解收敛。实验证明,PSO-VQ算法在解码图像的PSNR值和主观效果上都优于LBG算法,同时拓展了粒子群优化算法的应用领域。  相似文献   

11.
采用遗传算法的文本无关说话人识别   总被引:1,自引:0,他引:1  
为解决在说话人识别方法的矢量量化(Vector Quantization,VQ)系统中,K-均值法的码本设计很容易陷入局部最优,而且初始码本的选取对最佳码本设计影响很大的问题,将遗传算法(Genetic Algorithm,GA)与基于非参数模型的VQ相结合,得到1种VQ码本设计的GA-K算法.该算法利用GA的全局优化能力得到最优的VQ码本,避免LBG算法极易收敛于局部最优点的问题;通过GA自身参数,结合K-均值法收敛速度快的优点,搜索出训练矢量空间中全局最优的码本.实验结果表明,GA-K算法优于LBG算法,可以很好地协调收敛性和识别率之间的关系.  相似文献   

12.
在矢量量化(VQ)的码本设计过程中,经典的LBG算法收敛速度快,但极易陷入局部最优,且初始码本的生成对最佳码本的设计影响很大。考虑到遗传算法(GA)是一种具有全局优化搜索能力的算法,提出了GA和LBG算法相结合的GA-L算法来优化码本,改善了码本质量,并将其应用于汉语连续数字语音识别中,实验结果表明了GA-L算法的有效性。  相似文献   

13.
基于方差归一化失真测度的改进的LBG算法   总被引:3,自引:1,他引:2  
矢量量化(VQ)技术在话者识别系统中得到了广泛的应用。 VQ码本的产生通常采用 LBG算法,失真测度则为对矢量的各分量等权重的欧氏距离。在话者识别系统中特征矢量的各个分量的分布是有差别的,且对于不同的话者,这种差别的程度又是不一样的。由于不同分布的各维参数对话者识别的有效性各不相同,因此,文章提出了一种能反映这种有效性差别的失真测度,即:方差归一化失真测度。以该失真测度为基础,并结合时序相关的初始码本设计方法及有效的零胞腔处理技术,文章提出了改进的LBG算法,同时利用该算法训练出改进的VQ话者模型,并进行了话者识别实验。  相似文献   

14.
The vector quantization (VQ) was a powerful technique in the applications of digital image compression. The traditionally widely used method such as the Linde–Buzo–Gray (LBG) algorithm always generated local optimal codebook. Recently, particle swarm optimization (PSO) is adapted to obtain the near-global optimal codebook of vector quantization. An alternative method, called the quantum particle swarm optimization (QPSO) had been developed to improve the results of original PSO algorithm. In this paper, we applied a new swarm algorithm, honey bee mating optimization, to construct the codebook of vector quantization. The results were compared with the other three methods that are LBG, PSO–LBG and QPSO–LBG algorithms. Experimental results showed that the proposed HBMO–LBG algorithm is more reliable and the reconstructed images get higher quality than those generated from the other three methods.  相似文献   

15.
针对LBG算法初始码本随机选取后易出现空胞腔、易陷入局部极小、迭代次数大等缺陷,本文依据模糊聚类理论引入了矢量量化码本设计训练的模糊聚类与LBG级联算法:先用模糊聚类算法训练码本,将训练得到的码本作为传统LBG算法的初始码本,再用传统LBG算法训练.论述了模糊聚类和LBG联合算法的原理与方法;用该算法分剐训练了语音线性...  相似文献   

16.
采用模糊聚类C均值聚类确定型心改进LBG算法,实现语音参数MFCC码本的矢量量化,实验结果表明,该算法有着与单一LBG算法相近的量化误差,自适应确定码本大小码,码本尺寸显著降低,减小码本的存储量。  相似文献   

17.
This paper evaluates the impact of three special forms of the Minkowski metric (Euclidean, City Block, and Chebychev distances) on the performance of the conventional vector quantization (VQ) and Gaussian mixture model (GMM) based closed-set text-independent speaker recognition systems, in terms of recognition rate and confidence on decisions. For the VQ based system, evaluations are carried out using the two most common clustering algorithms, LBG and K-means, and it is revealed which clustering algorithm and distance pair should be used to exploit the best attribute of both to achieve the best recognition rate for a given codebook size. In the case of GMM based system, we introduce the metrics into the GMM using a concatenation of the LBG and K-means algorithms in estimating the initial mean vectors, to which the system performance is sensitive, and explore their impact on system performance. We also make comparison of results obtained from evaluations on clean speech (TIMIT) and telephone speech databases (NTIMIT and NIST2001) with the modern classifiers VQ-UBM and GMM-UBM. It is found that there are cases where conventional VQ based system outperforms the modern systems. Moreover, the impact of distance metrics on the performance of the conventional and modern systems depends on the recognition task imposed (verification/identification).  相似文献   

18.
Recently, medical image compression becomes essential to effectively handle large amounts of medical data for storage and communication purposes. Vector quantization (VQ) is a popular image compression technique, and the commonly used VQ model is Linde–Buzo–Gray (LBG) that constructs a local optimal codebook to compress images. The codebook construction was considered as an optimization problem, and a bioinspired algorithm was employed to solve it. This article proposed a VQ codebook construction approach called the L2‐LBG method utilizing the Lion optimization algorithm (LOA) and Lempel Ziv Markov chain Algorithm (LZMA). Once LOA constructed the codebook, LZMA was applied to compress the index table and further increase the compression performance of the LOA. A set of experimentation has been carried out using the benchmark medical images, and a comparative analysis was conducted with Cuckoo Search‐based LBG (CS‐LBG), Firefly‐based LBG (FF‐LBG) and JPEG2000. The compression efficiency of the presented model was validated in terms of compression ratio (CR), compression factor (CF), bit rate, and peak signal to noise ratio (PSNR). The proposed L2‐LBG method obtained a higher CR of 0.3425375 and PSNR value of 52.62459 compared to CS‐LBG, FA‐LBG, and JPEG2000 methods. The experimental values revealed that the L2‐LBG process yielded effective compression performance with a better‐quality reconstructed image.  相似文献   

19.
论文提出了一种利用Hopfield网络的码本设计方法,分析了LBG算法和离散Hopfield网络的特点,针对该特点构造聚类表格,并按离散Hopfield神经网络串行方式运行,从而得到最终码字集。通过实验表明,在码本大小相同的情况下,峰值信噪比提高了2.742~3.825 dB,生成的码本质量较传统的LBG算法更加有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号