首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
语音质量评估系统应用探讨   总被引:1,自引:0,他引:1  
本文简要介绍了语音质量评估系统的原理,以及在爱立信T A 系统中的应用,并通过一系列对比实验研究了语音编码、频率干扰和切换等各种网络参数的变化对语音质量的影响,分析指出了改进无线网络语音质量的方向。  相似文献   

2.
本文在统计实验的基础上指出,表示语音信号的特征变量往往并不严格服从正态分布。为此,文中提出几种语音特征变量的统计特征数,并给出了它们的估计方法.语音识别实验表明,这些统计特征数能较好地反映语音特征变量的分布性质。  相似文献   

3.
汉语语音理解系统的任务之一是把语音识别系统获得的汉语音节转换成正确的汉字,与汉语语音识别系统一起,完成一个语音-文本(SpeechtoText)的转换系统。本文利用一个有别于语音理解传统方法(1.语言学方法[1],2.统计学方法[2])的新的反馈式语音理解方案进行汉语地名的识别理解,获得了很好的实验结果。本文最后对实验结果和反馈式语音识别理解方案进行了讨论。  相似文献   

4.
传统语音增强算法在去除噪声的同时也导致语音受损,为了减小这种负面影响,结合了语音信号的稀疏表示算法与语音增强算法和自适应的获得训练字典,提出了一种基于自适应稀疏表示的语音增强算法。仿真实验结果表明该方法即使在低信噪比的条件下也能有效去噪,且去噪后能很好的分辨出原始语音信号。  相似文献   

5.
文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征,运用VQ技术实现了说话人自动识别。在10个说话人,1800个汉语数字和单词语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。  相似文献   

6.
闫昭宇  王晶 《信号处理》2020,36(6):863-870
语音增强的目的是从带有噪声的语音中分离出纯净语音,实现语音的质量和可懂度的提高。近年来,采用有监督学习的深度神经网络已经成为了语音增强的主流方法。卷积循环网络是一种新型的神经网络结构,包含编码层、中间层、解码层三个主要模块,其已经在语音增强任务中取得了较好的效果。时频注意力机制是一个由数个相连的卷积层通过跳跃连接构成的简单网络模块,在训练过程中可以计算语音幅度谱特征图的非邻域相关性,从而更加有利于网络关注到语音的谐波特性。本文将时频注意力机制引入卷积循环网络的编码层和解码层中,实验结果表明,在不同信噪比条件下,该方法相比基线卷积循环网络能够进一步提高语音质量和可懂度,且增强后的语音信号可以保留更多的语谱谐波信息,实现更低程度的语音失真。   相似文献   

7.
语音信号互信息估计的非线性搜索算法及识别应用   总被引:6,自引:0,他引:6  
基于互信息理论的语音识别方法不仅考虑了语音信号的时变分布特征,并且考虑了语音信号的统计分布特征,能有效地提高同类模式的凝聚度,减少非同类模式间的耦合性,在语音识别实验和实际应用中反映出良好的识别精度和很高的运行效率,与其它方法相比更适合嵌入式系统的语音识别应用。本文提出了一种互信息估计的非线性搜索算法,这一算法能够有效地处理语音信号时变分布特征的非线性波动,进一步提高语音模式互信息匹配的精度。  相似文献   

8.
王涛  全海燕 《信号处理》2020,36(6):1013-1019
基于深度神经网络的语音分离方法大都在频域上进行训练,并且在训练过程中往往只关注目标语音特征,不考虑干扰语音特征。为此,提出了一种基于生成对抗网络联合训练的语音分离方法。该方法以时域波形作为网络输入,保留了信号时延导致的相位信息。同时,利用对抗机制,使生成模型和判别模型分别训练目标语音和干扰语音的特征,提高了语音分离的有效性。实验中,采用Aishell数据集进行对比测试。结果表明,本文所提方法在三种信噪比条件下都有良好的分离效果,能更好地恢复出目标语音中的高频频段信息。   相似文献   

9.
基于最小统计量和掩蔽效应的单通道语音增强   总被引:4,自引:0,他引:4  
利用人耳感知的掩蔽特性,并结合含噪语音能量的最小统计量估计,提出了一种低信噪比下的单通道语音增强算法。该算法对原始语音在Bark频带能量的最小统计量进行估计,从而准确估计含噪语音信噪比,再从感知的角度,在时域和Bark频域上合理调整增强系数,以实现语音增强的目的。实验表明,该增强算法能够在减小语音失真的同时,很好地抑制背景噪声和残余音乐噪声。  相似文献   

10.
王骞  何培宇  徐自励 《信号处理》2020,36(6):902-910
针对现有深度神经网络语音增强方法对带噪语音的去噪能力有限、语音质量提升不高的问题,提出了一种基于奇异谱分析的深度神经网络语音增强方法。通过引入奇异谱分析算法对带噪语音进行预处理,以初步分离得到语音信号与噪声。接着将语音信号与噪声用于深度神经网络模型得训练,以得到性能更优的网络模型,从而使得本文方法具有更好的性能。最后在重建干净语音的环节中,同时使用神经网络估计得到的对数功率谱和带噪语音的对数功率谱,并加入了权重系数,使得本文提出的方法可以适应不同信噪比的情形,有效的去除背景噪声,降低语音信号的失真。本文通过仿真实验验证了该方法的有效性和鲁棒性。   相似文献   

11.
随着科技的进步,车牌识别系统有了很大的发展。其识别过程大概分为三个过程:车牌定位,字符分割和字符识别。由于在现实中车牌的识别会受到自然原因、人为原因以及图像采集设备的影响,这些会造成字符分割的不准确,从而导致识别的失败。基于此提出了在利用hough变换对车牌进行分割前用小波包变换的多分辨率进行降噪的方法,最后利用KL变换进行车牌字符识别的方法。实验表明其技术在速度和识别率等方面具有很好的效果。  相似文献   

12.
为了提高对车牌字符的准确识别能力,提出了一种基于权系数标识符矩阵的模板匹配车牌字符识别方法。具体方法是在进行字符识别前为每一个车牌字符制定一个标准化的模板,再将每一个模板字符的像素依据像素区域、像素边缘区域和非像素及非像素边缘区域等标记成不同的区域,并依此为基准生成一个模板矩阵。根据车牌字符闭合区域个数及字符二值图像中间行、中间列黑白跳变次数,可将字符分为10类。进行字符识别时,首先判定待识别字符属于哪一类,然后与所在类的每一个字符的标准模板进行匹配,统计待识别字符落在每一个标准模板矩阵的不同区域的像素数,并根据不同区域的不同权值计算相似度值,相似度值最大的即为识别结果。该方法采用两级分类法对车牌字符图像进行分类,再采用基于权系数标识符矩阵的模板匹配法对车牌字符进行识别。实验结果表明,该方法提高了识别结果的准确度,对于存在字符断裂以及形状相似而容易混淆的字符有较好的识别效果。  相似文献   

13.
In this paper, we propose a novel method for road recognition using 3D point clouds based on a Markov random field (MRF) framework in unstructured and complex road environments. The proposed method is focused on finding a solution for an analysis of traversable regions in challenging environments without considering an assumption that has been applied in many past studies; that is, that the surface of a road is ideally flat. The main contributions of this research are as follows: (a) guidelines for the best selection of the gradient value, the average height, the normal vectors, and the intensity value and (b) how to mathematically transform a road recognition problem into a classification problem that is based on MRF modeling in spatial and visual contexts. In our experiments, we used numerous scans acquired by an HDL‐64E sensor mounted on an experimental vehicle. The results show that the proposed method is more robust and reliable than a conventional approach based on a quantity evaluation with ground truth data for a variety of challenging environments.  相似文献   

14.
刘帅  王铎  孙腾飞 《红外》2014,35(6):36-39
红外波段可探测到足够多用以导航的星体。受限于客观条件,白天无法获取大量的星空图像。为了加快三视场恒星检测、星点定位和星图识别等算法的开发及算法性能的全面测试,需要研究三视场全天时星图的仿真方法。研究并建立了三视场天空辐射模型、系统噪声模型和恒星成像模型,设计并运行了三视场星图的生成软件。结果对加快算法的开发及算法性能的全面测试具有重要意义。  相似文献   

15.
主成成份分析(PCA)方法是人脸识别技术中常用的一种一维特征抽取方法。传统PCA方法用于人脸识别常常面临图像维数高,直接计算量的问题。为了解决这2个问题,人们对PCA进行了改进,提出并实现了多种基于PCA的人脸识别。对3种基于PCA的人脸识别方法做了理论上的研究和实验上的性能比较。实验结果表明PCA 2DPCA是其中综合效果最好的一种方法。  相似文献   

16.
针对GSM无线网络中存在的不足,从三个方面进行了讨论,对故障现象和原因进行了分析并提出了相应的解决办法。在此基础上说明了完善和优化无线网络性能的流程。  相似文献   

17.
When using wireless sensor networks (WSNs) for data transmission, some critical respects should be considered. These respects are limited computational power, storage capability and energy consumption. To save the energy in WSNs and prolong the network lifetime, we design for the signal control input, routing selection and capacity allocation by the optimization model based on compressed sensing (CS) framework. The reasonable optimization model is decomposed into three subsections for three layers in WSNs: congestion control in transport layer, scheduling in link layer and routing algorithm in network layer, respectively. These three functions interact and are regulated by congestion ratio so as to achieve a global optimality. Congestion control can be robust and stable by CS theory that a relatively small number of the projections for a sparse signal contain most of its salient information. Routing selection is abided by fair resource allocation principle. The resources can be allocated more and more to the channel in the case of not causing more severe congestion, which can avoid conservatively reducing resources allocation for eliminating congestion. Simulation results show the stability of our algorithm, the accurate ratio of CS, the throughput, as well as the necessity of considering congestion in WSNs.  相似文献   

18.
A recognition system for connected digits, which uses a statistical classifier to identify words in speaker-independent continuous speech, is described. The system uses the multiple similarity method, a statistical pattern recognition technique. For evaluating word strings, the system uses a scoring method that is independent of the number of words in the strings. It is derived from the a posteriori probability that a subinterval corresponds to a correct word position, giving a word similarity value. The system evaluates a word string using dynamic programming and a parallel search procedure. Experiments for the contextual effect of the training data set, for validation of the search algorithm, and for a large quantity of unspecified speakers including 40 males and 40 females were performed. For connected digits (unknown word lengths test), the string recognition rates were 90.1%-95.1% for two, three, or four connected digits, where the equivalent word (digit) rates were 97.4%-98.4%  相似文献   

19.
In the linguistic approach to pattern recognition, a special-purpose language is constructed, and algorithms using this language to analyze objects are developed. The algorithms described in this paper are for the analysis of experimental curves. A function to estimate the "complexity" of the curve parts is proposed. The algorithms differ from those for image processing in several respects. A significant feature of the computer-generated language is the good interpretability of its words by humans.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号