首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
胡毅  胡咏梅 《计算机工程与应用》2001,37(19):112-113,123
主要介绍了应用于语音压缩及多媒体处理技术中静音抑制算法,并通过该算法中语音检测算法和噪声发生器算法,以实现降低语音间隙的发送比特率,实现非连续发送。  相似文献   

2.
基于塔台管制模拟语音通讯系统,设计并实现了多路混音功能。发送端采用双线程多缓冲区机制保证数据的实时即时发送;在混音同步机制中引入了多个缓冲队列,为成功实现同步混音创造了良好条件;在最为重要的混音算法中做了一些改进,混音效率有明显提高。在该系统中使用了专门为声音解压缩研究设计的Speex语音解压缩库,其高性能的语音解压缩效率,在应用中得到了很好的体现。系统仿真实验结果表明该套多路混音实现方式切实可行,具有一定的有效性和优越性。  相似文献   

3.
本文介绍了语音识别系统芯片国产替代方案的实现.语音识别系统的硬件核心芯片采用富芮坤FR8016HA,系统接收由移动端通过蓝牙发送来的音频信号,之后对语音信号进行识别,最终将识别结果呈现到LCD显示屏上,实现人机交互.语音算法采用改进的DTW模板匹配法,通过测试,本系统语音识别正确率可达82%.  相似文献   

4.
为提高语音的传输质量,减少语音分组因网络状况恶化造成的丢失现象,在研究实时语音传输技术的基础上,提出了一种抗语音分组丢失的自适应传输调整算法.通过量化接收端反馈回发送端的语音分组丢失率等信息来判断网络状态,并通过改进AIMD(和式增加乘积减少)拥塞控制算法来自适应地随网络状态调整语音的传输速率,以此来达到抗语音分组丢失的效果.通过自行搭建拓扑结构的网络环境,对算法进行了测试分析,验证了该算法的有效性.  相似文献   

5.
1.6Kb/s类MELP语音压缩编码器的FPGA实现   总被引:2,自引:0,他引:2  
基于"CPU软核 模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时性的要求,从而为下一阶段语音压缩编码器的芯片设计提供有力的可行性论据.同时,由于本文给出的语音压缩编码器的实现结构中的各模块算法IP对于许多语音压缩编码算法中都适用,因此该语音压缩编码器的实现结构对不同的语音压缩编码算法具有一定的通用性.  相似文献   

6.
在研究了4.567kb/s ACELP的语音压缩编码算法基础上,通过分析其原理及其基本特征,在实际应用中提出了优化算法,原算法和优化后的算法分别用C语言仿真实现,发现优化后的算法提高了语音质量,并大大降低了算法复杂度。优化后的语音压缩编译码算法通过在AD-SP21535芯片上编程实现,人耳主观试听,发现其语音质量有较好的自然度,MOS值为3.7左右。  相似文献   

7.
频谱分析技术在语音信号处理中得到了广泛应用。短时频谱分析是各种语音频域处理方法的基础,广泛应用于语音编解码、语音合成、语音识别等领域。通过时频分析理论,对语音短时频谱分析与合成进行理论推导,表明语音短时频谱分析与合成可以通过加窗和滤波语音信号实现,并据此提出具体算法,按照该算法处理实际语音数据。合成语音与原始语音相比,差异很小。  相似文献   

8.
介绍了ISO发布的MPEG-4语音编码子集中所包含的甚低速率语音参量编码算法谐波矢量激励编码(HVXC),描述了算法中各个参数的分析和合成过程,并对算法进行了软件实现.针对实际情况提出了基于HVXC算法的改进方案.  相似文献   

9.
介绍了Speex语音编解码算法和定点数字信号处理芯片TMS320DM642,实现了Speex编解码算法C代码到TMS320DM642的移植,并根据TMS320DM642的特性及Speex算法中各个过程计算量的分布特点对代码中运算量较大的模块进行了有效的优化,最终实现了高效率的语音编解码器;通过试验证明,经过优化后的程序在内存占用和运算复杂度方面都达到了预期目标,并且具有较低的算法延迟和极高的语音音质.  相似文献   

10.
动态时间规整(Dynamic Time Warping)是语音识别中的一种经典算法,该算法简单有效,在实现孤立词识别系统中得到了广泛的应用.为了提高机器人语音识别系统的识别率和识别速度,文中采用了一种改进的DTW语音识别算法.在MATLAB 7.0环境下,对改进的语音端点检测和改进的DTW算法进行仿真实验,实验证明改进的算法提高了识别率,并且减少了识别所用的时间;将该算法移植到机器人上,在安静的环境下进行试验,结果表明机器人能准确而又快速地识别语音内容.最后,得到了改进的语音识别算法能够有效提高识别率和识别速度的结论.  相似文献   

11.
黄石磊  刘轶  程刚 《计算机工程》2012,38(18):19-21
为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静音具有不同的特性。实验结果表明,该算法能在窄带语音上提高PESQ得分与主观平均意见分的相关性。  相似文献   

12.
基于HMM的中文语音自动切分中的静音添加   总被引:1,自引:0,他引:1  
在建立语音语料库的过程中经常会碰到语音中加了很多对应文本所没有的静音标记,这些静音的存在直接影响到实际的切分结果。该文提出了一种静音自动添加的方法。在经过粗切分后,通过规则设定,短时能量、短时过零率和算法修正几个步骤,将静音寻找出来,添加到对应文本之中。该方法已运用到实际切分中,准确率在95%以上,取得了较好的效果。  相似文献   

13.
This paper describes a fast training algorithm for feedforward neural nets, as applied to a two-layer neural network to classify segments of speech as voiced, unvoiced, or silence. The speech classification method is based on five features computed for each speech segment and used as input to the network. The network weights are trained using a new fast training algorithm which minimizes the total least squares error between the actual output of the network and the corresponding desired output. The iterative training algorithm uses a quasi-Newtonian error-minimization method and employs a positive-definite approximation of the Hessian matrix to quickly converge to a locally optimal set of weights. Convergence is fast, with a local minimum typically reached within ten iterations; in terms of convergence speed, the algorithm compares favorably with other training techniques. When used for voiced-unvoiced-silence classification of speech frames, the network performance compares favorably with current approaches. Moreover, the approach used has the advantage of requiring no assumption of a particular probability distribution for the input features.  相似文献   

14.
周安福  刘敏 《计算机工程》2008,34(9):119-120
提出一种自适应的静音抑制算法,根据当前的噪声环境动态地调整静音抑制阈值,从而在用户处于静默状态时停止传输背景噪声包,能节省约50%的VoIP传输带宽。在低带宽的环境下,能够降低网络拥塞,大大提高VoIP通话效果。CDMA网络的实验结果验证了该算法的效用。  相似文献   

15.
小波变分辨率频谱特征静音检测和短时自适应混音算法   总被引:1,自引:0,他引:1  
静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729b静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729b静音检测算法的视频系统.  相似文献   

16.
Text-independent speech segmentation is a challenging topic in computer-based speech recognition systems. This paper proposes a novel time-domain algorithm based on fuzzy knowledge for continuous speech segmentation task via a nonlinear speech analysis. Short-term energy, zero-crossing rate and the singularity exponents are the time-domain features that we have calculated in each point of speech signal in order to exploit relevant information for generating the significant segments. This is down for the phoneme or syllable identification and the transition fronts. Fuzzy logic technique helped us to fuzzify the calculated features into three complementary sets namely: low, medium, high and to perform a matching phase using a set of fuzzy rules. The outputs of our proposed algorithm are silence, phonemes, or syllables. Once evaluated, our algorithm produced the best performances with efficient results on Fongbe language (an African tonal language spoken especially in Benin, Togo and Nigeria).  相似文献   

17.
提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐三类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和音乐六类。实验结果表明,男主持人语音、女主持人语音以及音乐的分类效果最好,查准率和查全率均可达90%以上;交替报道的分类性能最差,查准率为57.5%,查全率为79.3%;其他类别的分类性能居中,在70%~90%左右。与同类算法相比,该算法分类性能较高。  相似文献   

18.
罗瀛  曾庆宁  龙超 《计算机应用》2019,39(8):2426-2430
为提高双微阵列语音增强系统在多噪声环境下的消噪性能,提出一种适用于双微阵列的改进广义旁瓣抵消器语音增强算法。根据双微麦克风阵列的结构特点,首先,用基于噪声互功率谱估计的改进相干滤波算法消除距离较远麦克风之间产生的弱相关噪声;然后,利用广义旁瓣抵消算法消除距离较近麦克风之间产生的强相关噪声;最后,通过基于最小值控制递归平均的子带谱减法有针对性地消除不同频带上的残留噪声。仿真实验表明,在多噪声环境下所提算法较现有的双微阵列语音增强算法取得了更好的感知语音质量评价得分,一定程度上改善了双微阵列语音增强系统对复杂噪声的抑制效果。  相似文献   

19.
Silence detection and removal is an essential building block of any multimedia video conferencing system. It reduces the bandwidth requirements of the underlying network transport service and helps to maintain an acceptable end-to-end delay for audio. We analyze the requirements for a silence detection algorithm hosted on a multimedia communication system, and propose a novel low-complexity algorithm operating in the non-linear domain. After discussing the constraints which are imposed by the architecture of the system hardware (computer, packet-based network), we show that several recently proposed silence detection algorithms fail to meet all of these constraints. A new approach is then introduced, based on the small- and large-signal behavior of the speech waveform in the -law domain. The new algorithm is compared with a recent design that meets several of our requirements; experimental results indicate that it performs significantly better in the particular environment at hand.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号