首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
G.723.1协议是将音频信号压缩到5.3Kb/s和6.3Kb/s2种码率的音频编解码协议,主要应用在多媒体通信中的音频压缩。介绍一种基于Trimedia/Nexperia DSP的流结构TSSA(Trimedia Streaming Software Architecture)实现应用在可视电话中的G.723.1实时语音编解码。  相似文献   

2.
基于G.729A和G.729D的宽带语音编码实现   总被引:1,自引:1,他引:0  
根据7kHz声频编码标准G.722,采用正交镜像滤波器(Quadrature Mirror Fihers,QMF)法将宽带语音划分为等频带的子带,而后采用高质量的语音编码标准G.729,对低频带使用简化的G.729A,高频带使用较低比特的G.729D,实现了低时延的14.4Kb/s的宽带语音编码。  相似文献   

3.
OpenH323是一个开放源码的VoIP(Voice over IP)协议栈,支持H.323和SIP等多媒体通信协议,为多媒体应用提供了一个很好的开发平台。G.723.1是ITU-T建议在中低速率多媒体通信中使用的语音压缩算法,目前该算法已在IP电话系统中得到广泛应啊。基于OpenH323协议栈实现G.723.1Codec有着十分重要的应用价值。介绍在OpenH323的软件终端上实现G.723.1Codec的基本方法,并可推广到G.729等其它多种语音压缩算法。  相似文献   

4.
G.723.1标准是一种针对语音的极低码率编解码算法,该标准提供了6.3kb/s和5.3kb/s两种码率的编码算法,两种码率都能提供较好的语音质量。本文从G.723.1编码算法和解码算法2方面介绍了G.723.1极低码率编解码器算法,并从硬件实现方面对TMS320VC5416的性能参数和技术指标进行了简要的介绍,最后从实时语音信号采集、实时语音编码模块、实时语音解码模块、语音输出模块等几个方面描述了G.723.1编解码算法在TMS320VC5416上的实现过程。研究结果表明。在TMS320VC5416DSK可以实现对语音信号的实时编解码。  相似文献   

5.
0引言 第三代移动通信技术(3rd—generation,3G),是指能支持高速数据传输的蜂窝移动通讯技术。相对2.5G(GPRS/CDMA1x)100kbit/s左右的速度,3G目标能够达到300k~1Mbit/s。  相似文献   

6.
曹华  周德新 《信息技术》2005,29(8):146-149
介绍了G.729,G.723.1两种语音编码标准的主要用途和它们各自使用的算法。并就两种标准的编码算法的码率、线性预测分析、延时以及编码方法等几个方面进行了比较。在线性预测分析时主要是对两种算法在加窗时的不同进行了陈述;在编码方法的比较中又涉及到预处理时由于使用的高通滤波器的差别而导致G.729编码话音质量优于G.723.1的原因。  相似文献   

7.
陈素根  吴小俊 《电子学报》2017,45(2):408-416
针对投影孪生支持向量机(Projection Twin Support Vector Machine,PTSVM)在训练和求解过程中存在的问题,提出了一类改进的投影孪生支持向量机(Improved PTSVM),简称为IPTSVM.该文首先构造了改进的线性投影孪生支持向量机,然后利用核技巧轻松将其推广到了非线性形式.本文的主要贡献有:(1)提出了投影孪生支持向量机的新模型,克服了原始PTSVM在训练之前需要求解两个逆矩阵的问题;(2)继承了传统SVM(Support Vector Machine)的精髓,利用核技巧直接将线性IPTSVM推广到非线性形式;(3)引入了一个新的参数,可以调节模型的性能,提高了IPTSVM的分类精度.实验结果表明,与PTSVM算法相比较,IPTSVM不仅提高了分类精度,而且克服了PTSVM的一些不足.  相似文献   

8.
王坚 《中国新通信》2007,9(11):60-63
针对语音识别中快速说话人自适应问题,对已有的说话人支持权重算法进行改进,利用支撑向量机(Support Vector Machines,SVM)参与支持说话人选择过程,并采用最大后验概率(Maximum a Posteriori,MAP)代替最大似然(Maximum Likelihood,ML)准则进行支撑说话人权重的估算,最后对测试说话人进行线性组合。与现有的相关自适应方法相比,该算法能够有效提高自适应数据较少时的性能。实验结果表明,在仅有一句自适应语句的情况下系统汉字正识率从原有非特定人(Speaker Independent,SI)系统的45.67%到58.05%,相对原有说话人支持权重算法提高4.67%。  相似文献   

9.
实现了G.723.1语音压缩编码在数字对讲机基带系统的应用。其创新在于充分利用了DSP的处理能力以及CPLD硬件上的高速、高集成度和可编程性进行硬件电路设计,在对讲机频带和DSP资源有限的条件下,对G.723.1的定点C代码进行深度优化,最终在实际电路上,收端可以播放出发端传来的实时、连续和清晰的语音。  相似文献   

10.
苹果iPod Touc     
《今日电子》2010,(4):42-42
第二代8GB苹果iPod Touch同第一代相比,性能和功能上有了一些很明显的提升,包括802.11b/g无线局域网、蓝牙功能。第二代8GB苹果iPod Touch在基本设计及外型尺寸(4,3×2.4×0.31)上同上一代产品一样,具有相同的用户界面、应用平台以及操作系统。第二代8GB苹果iPOdTouch支持AAC(16~320Kb/s),受保护的AAC(来自iTunes商店),MP3(16~320Kb/s),MP3VBR,Audible(formats2,3,4),AppleLossless,AIFF和WAV格式。8GB苹果iPod Touch能以128Kb/s AAC format2格式存储多达3500首歌曲、20万张iPod可视图片以及20小时的视频。  相似文献   

11.
随着互联网(Internet)及无线网络的普及,基于网际协议的语音传输(VoIP)技术将呈爆发性成长,最终取代传统固话业务,跃居主流通讯方式.在此趋势之下,集成了VoIP技术的芯片将成为一个新的市场增长点.SVE1000是设计服务公司芯原微电子为客户设计的一款VoIP芯片,采用SMIC18 1ogic工艺.内部集成了芯原微电子ZSP(R)核以及CODEC核.本文将详细讨论SVE1000的测试验证以及量产解决方案.  相似文献   

12.
基于说话人分类技术的分级说话人识别研究   总被引:3,自引:0,他引:3       下载免费PDF全文
刘文举  孙兵  钟秋海 《电子学报》2005,33(7):1230-1233
识别正确率和抗噪性能固然是说话人识别的研究重点,但识别响应速度也是决定系统实用化的关键所在.本文成功地提出了基于说话人分类技术的分级说话人辨识方法,极大地提高了系统运行速度,随着注册说话人数的增多,较之传统的说话人辨识方法,其优势更加明显.同时在说话人确认中,该方法的使用,进一步提高了确认的正确率,有效地降低了错误接受和错误拒绝率.本文提出的可信度打分方法,也一定程度上改进了系统的性能.实验表明:基于说话人分类技术的说话人辨识方法使系统的运行速度平均提高了3.5倍,对说话人确认等误识率和最小误识率平均下降了53.75%.  相似文献   

13.
针对基于因子分析模型的说话人确认系统评分的复杂性以及需要较大运算量的问题,文章直接利用话者因子的余弦距离相似度来计算评分。首先在训练阶段和测试阶段分别用因子分析的方法从语音中估计出话者因子,然后直接利用话者因子评分。对比SVM和其它的JFA-GMM-UBM话者确认系统,本文中所采用的系统训练阶段和测试阶段的流程相同,并且目标话者模型只需要存储话者因子,存储量少。在NIST2008数据库上的实验结果表明,余弦距离评分对比其它因子分析模型的评分方法,更加简单,并且话者确认系统的性能也有提高。  相似文献   

14.
1 IntroductionTheoutputofspeechcoderswillbeprocesseddifferentlywhentransmittedinIPandATMnet works,comparedwiththecaseinPSTNnetworks.IfthecodestreamsfromsomespeechencoderaretransmittedinIPnetworks,theyshouldfirstofallbeprocessedbytheupperlayerandtranspo…  相似文献   

15.
This paper describes a Session Initiation Protocol (SIP) based solution for mobility management that provides seamless mobile multimedia services in a heterogeneous scenario where different radio access technologies are used (802.11/ WiFi, Bluetooth, 2.5G/3G networks). The solution relies on the so called “Session Border Controllers” which are now widely used in many commercial SIP telephony solutions, mainly to deal with NAT traversal. Session Border Controller functionality has been extended to support seamless mobility for multimedia applications. A prototype of the proposed solution focused on VoIP services has been implemented in a test bed which is able to perform seamless handovers (and NAT traversal) using the 802.11, Bluetooth and 3G (UMTS) access networks. Measurements results are reported which analyze the performance of the solution in a real world environment, using commercial WiFi and 3G services.  相似文献   

16.
Automatic speaker verification: A review   总被引:1,自引:0,他引:1  
The relation of speaker verification to other pattern-recognition problems in speech is discussed, especially the distinction between speaker verification and speaker identification. The prospects for automatic speaker verification, its settings and applications are outlined. The techniques, evaluations, and implementations of various proposed speaker recognition systems are reviewed with special emphasis on issues peculiar to speaker verification. Two large-scale operating systems using different analysis techniques and applied to different settings are described.  相似文献   

17.
This paper concerns robust and reliable speaker model training for text‐independent speaker verification. The baseline speaker modeling approach is the Gaussian mixture model (GMM). In text‐independent speaker verification, the amount of speech data may be different for speakers. However, we still wish the modeling approach to perform equally well for all speakers. Besides, the modeling technique must be least vulnerable against unseen data. A traditional approach for GMM training is expectation maximization (EM) method, which is known for its overfitting problem and its weakness in handling insufficient training data. To tackle these problems, variational approximation is proposed. Variational approaches are known to be robust against overtraining and data insufficiency. We evaluated the proposed approach on two different databases, namely KING and TFarsdat. The experiments show that the proposed approach improves the performance on TFarsdat and KING databases by 0.56% and 4.81%, respectively. Also, the experiments show that the variationally optimized GMM is more robust against noise and the verification error rate in noisy environments for TFarsdat dataset decreases by 1.52%.  相似文献   

18.
A new speaker verification method is presented which is based on likelihood score normalisation and employs the global speaker model. As a result of the normalisation, common speech and environmental factors are removed from input utterances so that differences between speakers are emphasised. Experimental results of text-independent verification tests show the effectiveness of this method  相似文献   

19.
噪声鲁棒性是影响话者确认系统实用化的关键问题之一,为了提高系统的噪声鲁棒性,本文设计了基于子带隐Markov模型(HMM)和多层感知机(MLP)的话者确认系统,系统由多个子带系统所构成,对每个子带分别建立基于背景模型的连续HMM话者确认模型,采用MLP对各个子带HMM的输出进行非线性拟合,并利用MLP直接做确认判决,在与文本有关的话者确认实验中,本文提出的模型较常规基于背景模型的HMM话者模型在确认性能和噪声鲁棒性上均有所提高,实验进一步表明,利用MLP进行拟合和判决在一定程度上解决了话者确认阈值设置的困难,有效地提高了确认系统的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号