首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了一种近似估计整帧图像最小量化失真度的模型和新的率失真优化的实时帧内更新准则,可使编码器直接计算出编码一帧图像的最小量化失真度,通过评估宏块帧内编码所增加的总量化失真度和减小的扩散失真度,以决定是否需要对此宏块进行帧内更新。经与传统的基于率失真的帧内更新相比和实验结果表明,更新算法在具有更小计算复杂度的同时,在大多数情况下可以取得更好的峰值信噪比值。  相似文献   

2.
提出针对语音检测的一种新的算法-傅立时谱矩阵,该方法以傅立叶变换为基础,对含噪语音信号直接进行分帧,对每帧做傅立叶变换后以帧为单位,构建能反映语音特征频段及能量的傅立叶谱矩阵.在傅立叶谱矩阵中找到语音信号能量的集中区域,从而找出所需的语音特征谱矩阵的范围,达到对语音的有效检测.  相似文献   

3.
本文对语音的上升过零间从发音机理及统计角度进行了分析,认为语音信号及其并分值信号的上升过零间隔较好地体现了不同语音之间的差异性,是一种进行语音识别的理想参数,并利用该参数建立模板,以非线性分块法进行时间对准,以相邻三帧最佳间匹配法进行模板匹配,用软件模拟了特定人,小词汇量,孤立词的语音识别,得到了较好的实验结果。  相似文献   

4.
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。  相似文献   

5.
每个汉字的发音都是由声母、韵母两部分构成的,声母部分发音时音短,信号变化剧烈;而韵母部分发音时间长、信号相对比较平稳。传统的孤立字识别方案是以线性预测系数作为语音模型系数,用动态时间弯折算法进行模式匹配,但它不完全适用于汉语的单音节识别。本文中利用语音信号相邻帧间LPC距离的变化进行声母、韵母分割,并根据声母、韵母的不同特性分别建立模式,提高了声母部分在整个音节模式中的比重,同时大幅度降低了模式的数据量,实验结果表明,汉语单音节的识别速度较传统的PLC/DTW算法提高一倍以上,识别正确率达到95%。  相似文献   

6.
传统的多频段语音增强是将频域分割成各个频段,并对每个频段单独进行语音增强,但是因为相邻频带的共振峰影响清晰语音估计,导致了语音识别效果不理想,为了减少相邻频带的共振峰带来的影响,提出了一种时域滤波中多频带语音增强的方法,通过将时域中的未处理语音过滤成各种等效的基于矩形带宽的子带,然后在每个频带中使用基于离散余弦变换(DCT)谱减法来估计清晰语音,并结合使用各个频带信噪比(SNR)获得频带特定加权因子。在SNR为0~10d B的汽车噪声、餐厅噪声、列车噪声、白色噪声和工厂噪声的环境下基于时域多频段语音增强算法增强效果优于现有的技术。  相似文献   

7.
语音技术在CTI系统中的应用   总被引:1,自引:0,他引:1  
CTI技术代表的是电话与计算机网络的集成,具有广泛的运用前景,而VAP技术则代表了通过语音技术进行信息处理的能力,文章阐述了语音合成和语音识别以CTI系统中的应用。  相似文献   

8.
仿生模式识别基本原理应用到非特定人连续语音识别中,在构建语音模型时,将高维空间点覆盖的理论应用到非特定人的连续语音识别的学习过程中,在识别时,采用高维空间覆盖动态搜索的方法,对连续语音进行动态搜索,这样就可以避免因分割错误而带来的错误识别.通过实验得到了较为满意的识别结果。  相似文献   

9.
二阶CMS用于电话语音识别的通道补偿   总被引:1,自引:0,他引:1  
顽健的电话语音识别的主要任务之一是克服通道噪声的影响。将二阶CMS方法应用到电话语音识别的通道补偿中,实验表明该方法的性能估于通常的CMS方法。  相似文献   

10.
针对电话语料比较缺乏的问题,提出了一种完全由软件模拟实现由纯净语音向电话质量语音转换的算法。该算法采用滤波器设计技术来模拟电话线路连接中各种模拟传输设备频率响应特性,并对电话通道环境中各种噪音行为等电话语音现象进行了模拟研究。频谱失真分析和识别实验结果表明,通过模型参数的合理设置和调整,该算法能有效地实现纯净语音向电话质量语音的近似模拟,使用由纯净数据生成的模拟语音可以获得与真实语音同等的识别性能。  相似文献   

11.
大词汇量连续语音识别由于其庞大的计算量和对存储单元巨大的需求,一直难以实时实现。但随着DSP技术的发展,对于中小词汇量连续语音的实时实现是有可能的。文中尝试采用TI公司新型号的DSP芯片,实现属于中小词汇量连续语音的数字连接词的实时识别。经实验表明,该系统基本能实现预期识别目标。  相似文献   

12.
为了提高语音端点检测的准确性,增强端点检测算法在噪声环境下的鲁棒性,提出两种新的端点检测参数。其中,基于临界频带的谱熵参数综合考虑了人耳对语音的感知特性以及语音信号和噪声信号的频域分布差异,差值频域能量参数考虑了语音帧和无声帧在频域上的能量差异。结合两种参数的优点,构成一种鲁棒的端点检测参数,同时,为了避免因阀值判决的单一性而产生误判,在端点检测过程中加入了基于特征分布统计的过渡段判决。试验结果表明,本研究提出的语音端点检测算法对语音帧和无声帧具有较好的区分性,在不同噪声且信噪比较低情况下,端点检测准确率相比传统抗噪端点检测算法均有所提升,特别是在非平稳噪声下,准确率提升超过5%。  相似文献   

13.
二维连续形变图像的识别   总被引:1,自引:0,他引:1  
为了解决计算机识别2帧图像是否属于连续形变问题,提出了一种新的算法:利用压线格分别提取2帧图像的边缘信息,以2帧图像压线格重心坐标的位移量作为判断图像发生形变的依据.具体如下:首先计算出第2帧图像中发生突变的压线格的数量;再用发生突变的压线格的数量与第1帧图像的方格数相比,如果比值小于或等于程序中设定的阈值,则此两帧图像属于连续形变,否则,属于非连续形变。  相似文献   

14.
为了提高视频质量评价的精确度和通用性,提出了一种基于失真度估计的无参考视频质量评价方法。首先,利用邻近像素点之间灰度差值的数理统计特性计算局部失真度,通过对视频进行高斯滤波后的细节损失进行计算得到全局失真度,再结合这两者估计视频整体的失真度;然后,通过帧内预测和帧间预测计算视频复杂度;最后,利用视频失真度和复杂度得到视频客观质量。实验结果表明,用本文方法可以获得很好的精确度,该方法具有广泛的通用性。  相似文献   

15.
语音识别与处理在电话通讯中的应用通过技术鉴定受河北省教委和河北省科委委托,我院于1994年8月11日主持召开了“语音识别与处理在电话通讯中的应用”的科研成果鉴定会.该课题是由我院刘教民、张彦斌、赵小英等老师共同研制完成的.鉴定会由刘志清处长主持,张留...  相似文献   

16.
本文提出了一种语音/数据同帧传输新方法。该方法对语音进行压缩处理,连续存放,收集无声期用于传输数据,与传统的语音/数据同帧传输方法相比,能明显提高信道资源利用率。网络实验表明,语音质量良好。  相似文献   

17.
本文对语音的上升过零间隔从发音机理及统计角度进行了分析,认为语音信号及其差分信号的上升过零间隔较好地体现了不同语音之间的差异性,是一种进行语音识别的理想参数,并利用该参数建立模板,以非线性分块法进行时间对准,以相邻三帧最佳匹配法进行模板匹配,用软件模拟了特定人、小词汇量、孤立词的语音识别,得到了较好的实验结果。  相似文献   

18.
为了解决连续的语音识别对端点的依赖性问题,提出了一种基于高维空间点覆盖动态搜索理论的非特定人问候语连续语音识别的新算法,该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小来判断识别结果.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

19.
电话远程控制不需进行专门的布线,不占用无线电频率资源,还可避免电磁污染。通过基于语音处理技术及DTMF解码技术的远程控制系统,运用语音识别技术,以及语音命令通过电话网络来控制家用电器的开与关,从而实现智能住宅中电器远程可控化。该系统通过嵌入式的智能语音提示,优秀的状态查询功能和密码控制系统,可使操作者根据各种提示音及时了解受控对象的有关信息。实验结果显示,系统可实现通过发出语音命令用电话远程控制多个家电,用户可以查询家电状态,提供密码功能,只有输入正确的密码才能控制家电,从而提高了安全性。  相似文献   

20.
提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号