首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
韩芳 《电声技术》2016,40(4):51-54
基音检测是河南方言语音信号处理中的一个重要环节,针对低信噪比环境下的河南方言语音基音检测准确率低的问题,提出了一种语音信号增强和基音检测相结合的算法.通过多窗谱估计的改进谱减法对语音信号进行降噪处理,对增强后的语音信号用中心削波法消除偏离基音轨迹的野点,再通过自相关法实现基音检测.仿真结果表明,对于低信噪比环境下河南方言语音信号的基音估值检测结果准确,估算出的基音频率和实际基音频率能很好的重合.  相似文献   

2.
基音信息隐含于语音信号的局部极值点处,将语音信号分帧后,通过修正由局部极值点拟合的包络线得到折线削波电平,并将削波后的信号用自相关函数法估计基音。数值实验表明,语音信号经折线削波较中心削波后可保留更多的基音信息,并能有效地减少基音检测的错误。  相似文献   

3.
语音信号是一种非平稳信号,基音周期是语音信号最重要的参数之一,传统的基音检测方法存在一些缺陷.小波变换鲁棒性强、能很好地反映信号的时频特性,非常适合处理非平稳信号.为准确提取基音频率,提出了一种基于小波变换的基音周期检测方法.检测前在小波域上用Teager能量算子分离出语音信号的浊音段,然后对浊音段采用空域相关函数降噪...  相似文献   

4.
基于形态滤波和小波变换的基音检测新方法   总被引:2,自引:1,他引:1  
提出了一种基于数学形态滤波和小波变换相结合的基音检测方法。检测前采用文中提出的形态滤波算法对噪声信号进行滤除,突出了基音周期。用小波变换对滤波后语音信号的突变点进行检测,进而提取出了基音周期。实验表明该方法对噪声有较强的鲁棒性,能够精确地检测出基音周期。  相似文献   

5.
基音周期是语音信号最重要的参数之一,其描述了语音激励源的一个重要特征。在噪声环境下,基音检测的准确率必然受到影响。文章提出基于小波变换的自相关(ACF)基音检测。通过实验仿真表明,该方法可有效地在信噪比较低的条件下提取语音的基音周期。  相似文献   

6.
周文  侯阿临 《电声技术》2006,(10):41-43
针对语音信号在小信噪比条件下检测其基音周期。考虑自适应滤波和小波变换的优点对小信噪比条件下的语音信号进行基音周期检测,实验证明此方法能有效检测-20dB下的基音周期。  相似文献   

7.
胡国强  金学成 《电子技术》2009,36(12):52-54
本文提出了一种基于线性预测残差倒谱的多语音基音频率检测算法,该算法首先对混合语音信号进行线性预测分析,进而计算预测信号与原混合信号的残差,并对残差信号做倒谱变换,得到混合语音信号的线性预测残差倒谱;然后在该信号的残差倒谱中,结合图像处理的技术,利用语音信号基音倒频匹配法检测出多语音信号的基音频率;最后在基音标定的过程中,本文算法利用语音信号的连续特性,依据信号基音频率前后差距变化最小原则标记出各基音所属话者。实验结果表明,本文提出的算法在弱回声及无回声的情况下能快速有效地从单声道混合语音信号中检测出多语音基音信息。  相似文献   

8.
一种适于计算声场景分析的混叠语音基音检测方法   总被引:5,自引:0,他引:5  
本文提出了一种在混叠语音信号中检测各自语音分量基音信息的方法.该方法采用小波变换作为基音检测模型中的滤波处理,并用广义自相关运算突出基音信息,用增强自相关累和消除冗余信息,并提出了用基音概率函数来预测并跟踪不同基音的变化以提高基音检测的准确性.本文提出的方法可应用于计算声场景分析中.实验结果表明,该方法对于混叠语音的基音检测是非常有效的.  相似文献   

9.
何峰  于东武  林嘉宇 《电声技术》2007,31(2):54-56,59
基于时域基音同步叠加算法完成了对语音信号的更改。首先求出语音信号的基音周期,接着对语音信号进行基音标注,然后对基音周期进行更改,最后,将语音信号按照更改后的基音周期基于时域基音同步叠加算法进行语音合成。实验表明,语音更改方法可得到很好的效果。  相似文献   

10.
本文提出了一种新的语音信号的基音周期检测方法,该方法根据语音信号的三阶累积量去确定语音信号的基音周期,能有效地排除白色或有色的高斯加性噪声所带来的干扰.与传统的基音周期估计的自相关函数法或平均幅度差函数法(AMDF)相比,该方法更精确、有效,具有更强的鲁棒性.  相似文献   

11.
This paper discusses robust speech section detection by audio and video modalities. Most of today's speech recognition systems require speech section detection prior to any further analysis, and the accuracy of detected speech section s is said to affect the speech recognition accuracy. Because audio modalities are intrinsically disturbed by audio noise, we have been researching video modality speech section detection by detecting deformations in speech organ images. Video modalities are robust to audio noise, but their detection sections are longer than audio speech sections because deformations in related organs start before the speech to prepare for the articulation of the first phoneme, and also because the settling down motion lasts longer than the speech. We have verified that inaccurate detected sections caused by this excess length degrade the speech recognition rate, leading to speech recognition errors by insertions. To reduce insertion errors, and enhance the robustness of speech detection, we propose a method that takes advantage of the two types of modalities. According to our experiment, the proposed method is confirmed to reduce the insertion error rate as well as increase the recognition rate in noisy environment.  相似文献   

12.
基于小波变换的语音基频提取新算法   总被引:2,自引:0,他引:2  
该文将小波变换应用于具有连续语音特征的三字词语音的基频提取,并针对实验中出现的问题对算法进行了改进,提出了一种新的基于小波变换的语音基频检测算法。该算法主要包括:离散小波变换计算、基于投票策略的基频点选择和基频起点确定、基频检查、异常点修正、头尾漏点处理以及基于投票策略的基频点精确定位。实验表明,该算法较好地克服了基于小波变换传统算法的不足,更适合于连续语音的基频提取,缺陷是需要较多的计算时间,不太适合于实时性要求较高的系统。  相似文献   

13.
王强  曾向阳  王曙光 《电声技术》2012,36(10):49-52
室内场所是语音识别技术的一种典型应用环境,传统的端点检测研究多考虑噪声的影响,忽略室内混响的影响,研究证明室内混响对端点检测和识别效果能造成显著的负面影响.通过研究短时能量和短时自相关序列( RAS),提出了一种自适应的端点检测方法.可以通过估计噪声段短时能量来适应平稳噪声干扰环境,并能修正含混响语音的检测终点.端点检测和语音识别实验结果表明,本方法在平稳噪声和室内混响声环境下具有良好的性能.  相似文献   

14.
在车内数字通信系统中,使用基于DSP嵌入式的以太局域网,实现车内语音和数据同传通信。笔者设计该系统时的重点是在语音数字处理,特别提出了一种自行设计的语音起止点判决方法--五点搜索法。  相似文献   

15.
Vowel onset point (VOP) is the instant at which the onset of vowel takes place in the speech signal. Accurate detection of VOP is useful for applications such as consonant–vowel (CV) unit recognition and speech rate modification. Existing VOP detection methods determine VOPs within 40 ms deviation, which may not be suitable for the applications mentioned above. In this paper, a two level approach using multiple sources of evidence is proposed for the accurate detection of VOP. In the proposed method, at the first level, VOPs are identified by combining the complementary evidence from excitation source, spectral peaks and modulation spectrum. At the second level, hypothesized VOPs are verified (genuine or spurious), and their positions are corrected using the uniform epoch intervals present in vowel region. Zero frequency filter method is used to determine the epoch locations in speech. Performance of the proposed method is analyzed using TIMIT database, and compared with the recent method which uses the combination of evidence from excitation source, spectral peaks and modulation spectrum. Using the proposed method about 85% of VOPs are detected within 10 ms deviation.  相似文献   

16.
方杰  李英  钱红 《电声技术》2006,(8):46-49
在研究双门限比较法的基础上,提出了语音端点检测不变门限三次搜索检测法,该方法主要由多词检测、端点修复和漏点检测3部分组成,有效解决了双门限比较法检测连续词端点的门限设置问题;在语音信号归一化的前提下,能以同一门限准确检测出语音信号的端点。在较低信噪比情况下,基于语音信号的短时相对自相关序列的短时平均幅度的端点检测能够获得较高的检测精度。  相似文献   

17.
设计了一套精确、方便、人性化的基于c#指纹识别系统。指纹识别经过图像预处理、特征提取、特征匹配三步骤。运用高斯一拉普拉斯算子的边缘检测方法进行图像分割、Poincare法提取中心点以及端点、分叉点后去伪点进行特征提取以及结合节点与方向场的匹配方法进行匹配。经过调试得到的识别结果表明:运行稳定、实时性好、识别率高,达到了预期的目标并能够很好地满足实际需求,具有广泛的应用前景。  相似文献   

18.
目适应同步叠加语音时长规整算法   总被引:3,自引:0,他引:3  
针对时域同步叠加时长规整算法计算量大,不适合在实时语音处理中应用的情形,提出了一种新的基于同步叠加方法的时长规整算法——自适应同步叠加算法,根据语音信号的准周期性质,即时调整搜索算法中的搜索间隔,以最快的速度找到最准确的叠加位置,从而达到实时处理的目的。该算法的分析测试表明,合成的语音质量高、实时性好,可以有效地应用到实时语音处理场合中。  相似文献   

19.
该文提出了分段线性动态系统周期轨道的时域法求解及稳定性判断的新方法。分段线性动态系统的状态空间被切换面分割成若干个线性子区间。借助MATLAB,联合求解周期轨道在各子区间的状态转移方程,可得该周期轨道在各切换面的切换点坐标及在各子区间的运行时间,从而得到该周期轨道的分段时间表达式。由该表达式,可导出该周期轨道在某一切换面的庞加莱映射方程及其雅可比矩阵,根据其特征值可判断周期轨道的稳定性。以三阶、四阶蔡氏电路为例,用该方法求出了它们的多个周期轨道,进行了稳定性判断,数字仿真表明该文所提出的新方法是可行的和正确的。  相似文献   

20.
In this paper, we propose the use of data‐driven probabilistic utterance‐level decision logic to improve Weighted Finite State Transducer (WFST)‐based endpoint detection. In general, endpoint detection is dealt with using two cascaded decision processes. The first process is frame‐level speech/non‐speech classification based on statistical hypothesis testing, and the second process is a heuristic‐knowledge‐based utterance‐level speech boundary decision. To handle these two processes within a unified framework, we propose a WFST‐based approach. However, a WFST‐based approach has the same limitations as conventional approaches in that the utterance‐level decision is based on heuristic knowledge and the decision parameters are tuned sequentially. Therefore, to obtain decision knowledge from a speech corpus and optimize the parameters at the same time, we propose the use of data‐driven probabilistic utterance‐level decision logic. The proposed method reduces the average detection failure rate by about 14% for various noisy‐speech corpora collected for an endpoint detection evaluation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号