首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
本文对神经网络语音识别中的语音特征提取、网络结构以及学习算法进行了初步的研究,提出了一种用于时特征矢量量化的简化和改进的自组织神经网络模型VQNN。VQNN中引入了动态规划法估计语音样本矢量的码本类中心初值并确定网络的初始权矩阵,可构造出256个量化等级的码本矢量。该方法具有较强的鲁棒性且矢量量化过程简单迅速。对28个地名的语音量化识别实验结果表明了这种量化方法对时识别的有性。  相似文献   

2.
华婷婷  肖铁军 《微计算机应用》2007,28(11):1164-1168
提出了一种基于模糊C-means聚类法的矢量量化,并将其用于语音特征的矢量量化。从语音信号中提取12阶MFCC倒谱系数作为待分群样本的矢量数据,有效地降低数据量及计算量,并可以避免杂信的不良影响。且实验得到的码本分布合理,没有空类,表明了该量化方法对语音识别很有效。  相似文献   

3.
基于矢量量化的说话人识别研究   总被引:7,自引:0,他引:7  
说话人识别可以看作语音识别的一种,是当前研究的热点之一。阐明了说话人识别的基本概念、发展状况以及原理和方法,并介绍了一种基于矢量量化的且与文本无关的说话人识别系统。  相似文献   

4.
自适应矢量量化在语音处理中有广泛的应用,提出了一种基于SFCM算法的自适应矢量量化码本的训练方法,其特点是通过模糊聚类方法,重新调整训练样本与码字之间的隶属度,达到最小编码失真,使码本更适合新说话人,且计算简单,方法的实验结果表明,可以使编码平均失真下降。  相似文献   

5.
为解决采用矢量量化的方法进行说话人识别时出现的失真问题,根据汉语语音的发音特性,提出了将矢量量化与语音特征的聚类技术相结合的方法,在进行矢量量化码书训练之前,先对特征矢量进行聚类筛选。实验结果表明,当测试语音片段长度为4 s时,在保持95%左右识别率下,采用普通矢量量化方法需64码本数,而采用该文方法只需8码本数,降低了8倍。结果说明该方法不但在一定程度上解决了因训练样本不足而引起的失真问题,而且通过方法的改进,实现了采用较低码字数产生较好的识别结果,从而提高识别效率。  相似文献   

6.
介绍了语音识别的发展历史和国内外语音识别研究的现状,讨论了语音识别的几个基本问题和影响语音识别的因素,并分析了目前常用的语音识别的各种方法,指出了其优缺点,最后讨论了评价语音识别系统时应考虑的几个技术指标和将来语音处理的发展方向等。  相似文献   

7.
8.
语音端点检测在语音处理中占有非常重要的地位,传统的检测方法是基于短时能量和过量率的双门限比较法,但是在信噪比较低的情况下,利用短时能量和过量率很难得到准确的检测结果。另外,在双门限比较法中,判别门限的取值对整个端点的检测影响很大,而这个门限值往往是靠经验所得,具有不稳定性。因此,针对传统方法的不足,根据语音帧间相关性,提出了一种改进算法。让语音信号通过双门限比较,完成端点检测的一级粗判,在语音起止点的模糊帧段,取一定范围的信号矢量,让这些矢量经过处理后再通过有限状态矢量量化器(FSVQ),得到量化矢量,再对量化矢量进行二级细判,从而得到准确的语音起止点。将改进算法应用于汉语连续数字语音识别,平均识别时间由原来的0.871s缩短为0.719s,平均识别率由原来的81.47%上升至89.13%,实验结果表明了该算法的有效性。  相似文献   

9.
采用模糊聚类C均值聚类确定型心改进LBG算法,实现语音参数MFCC码本的矢量量化,实验结果表明,该算法有着与单一LBG算法相近的量化误差,自适应确定码本大小码,码本尺寸显著降低,减小码本的存储量。  相似文献   

10.
图象压缩的模糊竞争矢量量化方法   总被引:2,自引:0,他引:2       下载免费PDF全文
在分析神经网络竞争学习算法和模糊C均值算法的基础上,提出了模糊竞争学习算法,并对模糊隶属度函数进行了探讨。理论分析和实验结果表明,模糊竞争学习算法用于图象矢量量化压缩编码是一种非常有效的方法。  相似文献   

11.
基于K-MEANS算法的语境相关矢量量化   总被引:1,自引:0,他引:1  
研究用于连续语音识别的语境相关矢量量化技术.提出采用k-means(k-均值)算法逐一地调整决策树叶子所包含的各个语境,实现对音素模型的混合密度的优化.实验结果表明,采用k-means算法的语境相关矢量量化得到的平均分布密度比简单合并决策树叶子所得到的平均分布密度提高4%~10%.  相似文献   

12.
一种基于模糊聚类的图象分割方法   总被引:15,自引:0,他引:15  
模糊C-均值(FCM)算法用于图象分割,是一种非监督模糊聚类后标定的过程,但是,FCM算法存在着一些不足,进而限制了它在某些方面的应用,本文提出了一种基于模糊聚类的图象分割方法,较好解决了FCM算法所遇到的问题,且本文从数学上和实验上证明了这种方法的有效性。  相似文献   

13.
基于模糊聚类优化的分形图像压缩快速算法   总被引:4,自引:0,他引:4  
本文针对经典分形压缩算法中编码时间过长的问题提出了一种改进算法。将陈武凡教授提出的模糊聚类优化(Optimal Fuzzy Clustering,OFC)方法改进并应用于对搜索空间的软分类,匹配时通过用类内搜索取代全局搜索,降低了编码时间。相同运算环境下的仿真实验结果表明,在不影响信噪比和压缩比的前提下,与经典分形压缩算法相比,OFC算法编码速度可提高大约5倍;同近期文献报道的基于小波系数硬分类(Wavelet-hased Block Classified,WBC)和基于经典LBG硬分类的快速分形压缩算法结果相比也均有明显的改善,这都证明了本文算法的优越性。  相似文献   

14.
基于模糊理论的地面三维目标识别方法   总被引:1,自引:0,他引:1  
本文就模糊理论在模式识别领域中的应用 ,对地面三维目标进行模糊模式识别的实现做了一些研究工作 .利用成熟的二维图像识别技术与多对一模型和目标类型建库方法的结合 ,完成对三维目标的识别  相似文献   

15.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

16.
基于DCT子空间失真测度的快速矢量编码算法   总被引:1,自引:0,他引:1  
周汀  章倩苓 《计算机学报》1997,20(5):421-426
在本文中,我们介绍了一种基于离散余弦变换子空间失真测度的恢复速失量编码算法。该算法利用DCT子空间映射,将失真测度维数从16降至4,从而使编码计算复杂度隆为1/4,并且结合部分失真算法进一步减少了编码 计算复杂度。  相似文献   

17.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音  相似文献   

18.
基于汉语语音特点的大词表语音识别系统的研究   总被引:2,自引:0,他引:2  
本文探讨了汉语语音识别的若干问题,并简单介绍了一个大词表汉语语音识别系统,该系统充分考虑了汉语语音的特点,其中主要是汉语语音具有音节性比较强的特点、音节的简单声韵母结构以及汉语以词/词组为语音交流基础的特点.该系统一个显著的特点是系统可以不进行任何训练地添加新词汇,从而使得系统具有比较好的用户接口. 现在系统具有10,000多个词汇,实时测试的平均识别结果是93.1%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号