首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
主要介绍了应用于语音压缩及多媒体技术中静音抑制算法,并通过该算法中语音检测算法和噪声发生器算法,以实现降低语音间隙的发送比特率,实现非连续发送。  相似文献   

2.
基于塔台管制模拟语音通讯系统,设计并实现了多路混音功能。发送端采用双线程多缓冲区机制保证数据的实时即时发送;在混音同步机制中引入了多个缓冲队列,为成功实现同步混音创造了良好条件;在最为重要的混音算法中做了一些改进,混音效率有明显提高。在该系统中使用了专门为声音解压缩研究设计的Speex语音解压缩库,其高性能的语音解压缩效率,在应用中得到了很好的体现。系统仿真实验结果表明该套多路混音实现方式切实可行,具有一定的有效性和优越性。  相似文献   

3.
本文介绍了语音识别系统芯片国产替代方案的实现.语音识别系统的硬件核心芯片采用富芮坤FR8016HA,系统接收由移动端通过蓝牙发送来的音频信号,之后对语音信号进行识别,最终将识别结果呈现到LCD显示屏上,实现人机交互.语音算法采用改进的DTW模板匹配法,通过测试,本系统语音识别正确率可达82%.  相似文献   

4.
提出一种采用HOOK机制实现以即时通信语音流为隐藏载体的隐写模型,在通信软件的发送端挂接两个"钩子",采集即时通信语音流作为载体进行实时机密信息嵌入与提取,实现交互式的隐蔽通信过程。选择目前普遍使用的Google talk软件作为研究对象,重点研究Gtalk的iSAC语音编码的隐写方法,建立一种基于LPC参数量化的隐写算法,实现iSAC语音编码下的隐写方法。实验结果表明,该隐写模型适用于目前的即时通信软件的隐蔽通信,拓展了基于VoIP的信息隐写的应用范围;该隐写算法具有良好的隐写容量和隐写速率。  相似文献   

5.
为提高语音的传输质量,减少语音分组因网络状况恶化造成的丢失现象,在研究实时语音传输技术的基础上,提出了一种抗语音分组丢失的自适应传输调整算法.通过量化接收端反馈回发送端的语音分组丢失率等信息来判断网络状态,并通过改进AIMD(和式增加乘积减少)拥塞控制算法来自适应地随网络状态调整语音的传输速率,以此来达到抗语音分组丢失的效果.通过自行搭建拓扑结构的网络环境,对算法进行了测试分析,验证了该算法的有效性.  相似文献   

6.
《电子技术应用》2016,(5):78-81
针对残疾人的前臂假肢在端水等运动过程中需要手部虎口一直与大地保持平行,即手部实现姿态自平衡问题,提出采用四元数的姿态解算算法,并采用卡尔曼滤波融合MPU6050传感器中陀螺仪和加速度计的输出数据,补偿了陀螺仪输出数据的随机漂移误差,得到前臂假肢手部姿态的正确估计。该系统由安卓手机、STM32单片机、MPU6050传感器、高性能数字舵机组成,通过安卓手机语音识别向STM32单片机发送是否保持手部自平衡指令,由STM32实时采集MPU6050中陀螺仪和加速度计的数据并经过算法处理后,通过串口向舵机发送信号。实验结果表明,这种姿态估计算法有效地解决了前臂假肢在运动过程中手部自平衡问题,为前肢缺失的残疾人提供了便利。  相似文献   

7.
基于复杂网络的垃圾短信过滤算法   总被引:1,自引:0,他引:1  
对垃圾短信发送用户的识别和过滤具有十分重要的研究价值和社会意义. 随着新形式和内容的垃圾短信出现, 传统的关键字匹配和发送速度频率过滤方法无法有效地处理这一问题. 在对短信发送/接收网络形式化表达的基础上, 以真实短信发送和接收以及通话关系数据为例, 统计和分析了短信发送网络的网络特性. 进一步分析和挖掘了垃圾短信用户在网络上发送接收的异常模式和行为, 并以此提出了一个基于语音关联程度和短信回复比率的过滤算法(NASFA算法). 通过实验和分析表明, 本文的算法能够高效地识别垃圾短信发送用户, 同时能够有效地控制将正常用户误识别为垃圾短信用户的比率.  相似文献   

8.
提出了一种采用自适应差分脉冲编码技术的语音压缩编码算法,压缩比为8:3,因其算法非常简单,可用单片机(如51系列)实现.此算法可用于低成本的单片机语音存储系统或语音传输系统.最后还给出了此算法在远距离语音信号传输中的应用实例,在此实例中采用的是C8051 F330单片机,在RS-422传输信道上实现了全双工远距离语音信号传输.  相似文献   

9.
针对CS-ACELP语音编码算法编码复杂度较高、DSP实时实现比较困难的问题,提出了一种可降低CS-ACELP语音编码算法复杂度的优化方法,分析了CS-ACELP语音编码算法原理,详细介绍了优化的CS-ACELP语音编码算法从固定码本搜索上降低算法复杂度的实现,并给出了在16位定点DSP芯片TMS320VC5402上实现CS-ACELP语音编解码方案的硬件及软件设计。实验结果表明,优化的CS-ACELP语音编码算法降低了运算复杂度,提高了运行速度,重建的语音符合标准的编解码要求。  相似文献   

10.
1.6Kb/s类MELP语音压缩编码器的FPGA实现   总被引:2,自引:0,他引:2  
基于"CPU软核 模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时性的要求,从而为下一阶段语音压缩编码器的芯片设计提供有力的可行性论据.同时,由于本文给出的语音压缩编码器的实现结构中的各模块算法IP对于许多语音压缩编码算法中都适用,因此该语音压缩编码器的实现结构对不同的语音压缩编码算法具有一定的通用性.  相似文献   

11.
黄石磊  刘轶  程刚 《计算机工程》2012,38(18):19-21
为提高语音质量客观评估的性能,提出一种改进的语音质量感知评估(PESQ)算法。该算法利用音节稳定性检测和清浊静音分类的方法,通过音节的帧间稳定性和损伤参数来描述语音听觉感知所受到的影响,这些参数对不同的语音段,如清音、浊音和静音具有不同的特性。实验结果表明,该算法能在窄带语音上提高PESQ得分与主观平均意见分的相关性。  相似文献   

12.
基于HMM的中文语音自动切分中的静音添加   总被引:1,自引:0,他引:1  
在建立语音语料库的过程中经常会碰到语音中加了很多对应文本所没有的静音标记,这些静音的存在直接影响到实际的切分结果。该文提出了一种静音自动添加的方法。在经过粗切分后,通过规则设定,短时能量、短时过零率和算法修正几个步骤,将静音寻找出来,添加到对应文本之中。该方法已运用到实际切分中,准确率在95%以上,取得了较好的效果。  相似文献   

13.
This paper describes a fast training algorithm for feedforward neural nets, as applied to a two-layer neural network to classify segments of speech as voiced, unvoiced, or silence. The speech classification method is based on five features computed for each speech segment and used as input to the network. The network weights are trained using a new fast training algorithm which minimizes the total least squares error between the actual output of the network and the corresponding desired output. The iterative training algorithm uses a quasi-Newtonian error-minimization method and employs a positive-definite approximation of the Hessian matrix to quickly converge to a locally optimal set of weights. Convergence is fast, with a local minimum typically reached within ten iterations; in terms of convergence speed, the algorithm compares favorably with other training techniques. When used for voiced-unvoiced-silence classification of speech frames, the network performance compares favorably with current approaches. Moreover, the approach used has the advantage of requiring no assumption of a particular probability distribution for the input features.  相似文献   

14.
周安福  刘敏 《计算机工程》2008,34(9):119-120
提出一种自适应的静音抑制算法,根据当前的噪声环境动态地调整静音抑制阈值,从而在用户处于静默状态时停止传输背景噪声包,能节省约50%的VoIP传输带宽。在低带宽的环境下,能够降低网络拥塞,大大提高VoIP通话效果。CDMA网络的实验结果验证了该算法的效用。  相似文献   

15.
小波变分辨率频谱特征静音检测和短时自适应混音算法   总被引:1,自引:0,他引:1  
静音检测算法使用两种语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729b静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729b静音检测算法的视频系统.  相似文献   

16.
Text-independent speech segmentation is a challenging topic in computer-based speech recognition systems. This paper proposes a novel time-domain algorithm based on fuzzy knowledge for continuous speech segmentation task via a nonlinear speech analysis. Short-term energy, zero-crossing rate and the singularity exponents are the time-domain features that we have calculated in each point of speech signal in order to exploit relevant information for generating the significant segments. This is down for the phoneme or syllable identification and the transition fronts. Fuzzy logic technique helped us to fuzzify the calculated features into three complementary sets namely: low, medium, high and to perform a matching phase using a set of fuzzy rules. The outputs of our proposed algorithm are silence, phonemes, or syllables. Once evaluated, our algorithm produced the best performances with efficient results on Fongbe language (an African tonal language spoken especially in Benin, Togo and Nigeria).  相似文献   

17.
提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐三类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和音乐六类。实验结果表明,男主持人语音、女主持人语音以及音乐的分类效果最好,查准率和查全率均可达90%以上;交替报道的分类性能最差,查准率为57.5%,查全率为79.3%;其他类别的分类性能居中,在70%~90%左右。与同类算法相比,该算法分类性能较高。  相似文献   

18.
罗瀛  曾庆宁  龙超 《计算机应用》2019,39(8):2426-2430
为提高双微阵列语音增强系统在多噪声环境下的消噪性能,提出一种适用于双微阵列的改进广义旁瓣抵消器语音增强算法。根据双微麦克风阵列的结构特点,首先,用基于噪声互功率谱估计的改进相干滤波算法消除距离较远麦克风之间产生的弱相关噪声;然后,利用广义旁瓣抵消算法消除距离较近麦克风之间产生的强相关噪声;最后,通过基于最小值控制递归平均的子带谱减法有针对性地消除不同频带上的残留噪声。仿真实验表明,在多噪声环境下所提算法较现有的双微阵列语音增强算法取得了更好的感知语音质量评价得分,一定程度上改善了双微阵列语音增强系统对复杂噪声的抑制效果。  相似文献   

19.
Silence detection and removal is an essential building block of any multimedia video conferencing system. It reduces the bandwidth requirements of the underlying network transport service and helps to maintain an acceptable end-to-end delay for audio. We analyze the requirements for a silence detection algorithm hosted on a multimedia communication system, and propose a novel low-complexity algorithm operating in the non-linear domain. After discussing the constraints which are imposed by the architecture of the system hardware (computer, packet-based network), we show that several recently proposed silence detection algorithms fail to meet all of these constraints. A new approach is then introduced, based on the small- and large-signal behavior of the speech waveform in the -law domain. The new algorithm is compared with a recent design that meets several of our requirements; experimental results indicate that it performs significantly better in the particular environment at hand.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号