首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对在采用LPC-10e和MELP两种不同的语音编码算法标准的通信系统中实现相互通信,提出一种从LPC-10e语音编码到MELP语音编码的参数直接转换方案,实现LPC-10e语音编码的基音周期、清浊音判决参数等转换成MELP语音编码相应参数。仿真结果表明,参数直接转换方案不仅提高了合成语音质量,而且降低了15%左右的编码运算量。  相似文献   

2.
在混合激励线性预测(MELP)语音编码算法中,语音帧的突变转换导致合成语音质量的下降成为一个突出问题。为解决该问题,提出一种基于过渡帧判决算法的改进MELP模型,提高了参数估计的准确度,有效实现了语音的降噪处理。引入动态清浊音判决(U/V判决)门限将语音帧分为3种类型:浊音帧、清音帧、过渡帧,通过区分过渡帧和清浊音帧,避免了传统的U/V判决错误和清浊音帧的突变转换。给出了改进MELP编码参数比特分配表,通过PESQ—MOS测试表明,合成语音质量尤其是高频女声合成语音质量有了明显的改进。  相似文献   

3.
本文提出了几种低速率编码算法的改进,编码速度都在1.6kbit/s以下,并且已经在某些DSP芯片上得到实时实现。  相似文献   

4.
介绍了第三代通信系统中的可选模式语音声码器(SMV)语音编码方式,简要描述了SMV的编、解码基本原理。并进行了该算法的定点C代码仿真,给出了算法的性能、计算复杂度及存储空间等仿真结果。  相似文献   

5.
在标准混合激励线性预测(MELP)语音编码算法中,对同时含有清音和浊音的混合帧会产生参数估计错误,并且导致合成语音质量的下降。针对这个缺陷提出一种基于过渡帧判决算法的改进MELP模型(M-MELP),提高了参数估计的准确度,保证了合成语音的质量,并结合TMS320C6416数字信号处理器的结构特点,通过改写开源的MELP算法实现M-MELP算法,从程序结构、编译器和代码进行三级优化。相对于单一的优化,能更好的提高程序运行的并行性和存储器的访问效率,从而在基于DSP的嵌入式系统中实现高质量的实时语音编码。  相似文献   

6.
一种改进的线性预测语音编码技术及实现   总被引:1,自引:1,他引:1       下载免费PDF全文
线性预测编码是实现语音编码的一项重要技术,介绍了线性预测编码技术的实现,提出一种改进型的声激励线性预测语音编码方法。最后,将简单LPC语音编码与声激励LPC语音编码进行比较。实验结果表明,该方法能够很好地实现语音编码,声音效果也比简单LPC更理想。  相似文献   

7.
介绍了ISO发布的MPEG-4语音编码子集中所包含的甚低速率语音参量编码算法谐波矢量激励编码(HVXC),描述了算法中各个参数的分析和合成过程,并对算法进行了软件实现.针对实际情况提出了基于HVXC算法的改进方案.  相似文献   

8.
文中提出了一种改进的LPC语音编码方法,利用某些语音段声道变化缓慢的特性和基于似然比失真来判断LPC系统相似度,可以把LPC的码率降到1.7Kbps以下,而且仍有较好的合成语音质量。  相似文献   

9.
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。  相似文献   

10.
俸世洲  周尚波 《计算机应用》2017,37(11):3323-3329
高校招生在线咨询通常采用人工回复或基于关键词匹配的问答系统来处理,常存在人工回复效率低下,问答系统答非所问的问题;此外,咨询文本往往比较简短,文本向量化表示易导致高维稀疏问题。针对上述问题,提出一种基于栈式降噪稀疏自编码网络(SDSAE)的招生咨询算法。首先,利用自编码网络对短文本进行特征提取和降维,引入数据集增强技术和添加噪声技术解决训练样本规模较小且分类不均问题,提高算法的泛化能力;获得短文本低维特征表示后,结合反向传播(BP)算法对文本进行分类。所提算法分类效果优于BP、支持向量机(SVM)、极限学习机(ELM)等算法,能显著提高招生咨询文本的分类效果。  相似文献   

11.
运动目标检测算法在视频监控等领域应用广泛,但是现实场景中由于噪音、光照变化等因素导致背景复杂多变,传统的运动目标检测算法往往效果不佳. 为了提升算法效果,提出了一种新的基于深度编解码网络的运动目标检测算法,将问题转化为像素级的语义分割问题. 事先使用大量数据离线训练出一个编解码网络,来学习背景与视频帧之间的差异性,实际应用中首先使用高斯混合模型进行背景建模,之后将所得背景与视频帧作为网络输入即可直接获取检测结果. 该方法利用了深度卷积网络在抗噪及特征学习等方面的优点,无需进行复杂的参数调优即可实现高性能的运动目标检测. 我们在CDnet2014数据集上进行了实验评估,实验结果显示我们所提出的算法较原GMM算法有很大提升,甚至在一些场景中的表现优于现有的一些顶尖算法. 另外得益于非常简单的背景建模方法以及网络结构,我们的算法在使用GPU的情况下能够近乎实时地进行运动目标检测,实用性很强.  相似文献   

12.
针对人脸表情识别鲁棒性差,容易受身份信息干扰的问题,提出一种具有局部并行结构的深度神经网络识别算法。首先使用稀疏自编码算法训练得到不同尺度的卷积核,然后提取卷积核特征并作池化处理,使特征具有一定的平移不变性,最后采用与表情相关的7个并行的4层网络得到最终的分类结果。实验结果表明,在标准的人脸表情识别库上进行独立测试时,本文提出的局部并行深度神经网络的表情识别方法对测试集的人不出现在训练集中的情况有较好表现,相比其他算法更具有实用性。  相似文献   

13.
针对现有海量数字图像信息落后,提出了新型的压缩算法,设计出基于FPGA的视频图像采集系统.应用深度卷积神经网络优化视频图像编码算法和聚类算法实现数据特征提取,将图像与距离信息作为深度卷积神经网络的输入与输出,并利用其特征提取能力学习图像特征的距离信息,提取深度卷积神经网络中的全连接层作为编码,通过迭代调整确定图像编码,完成图像压缩.应用测试结果显示,该算法具有较高效率优势,且图像压缩解码后质量较好.  相似文献   

14.
赵勇  巨永锋 《测控技术》2018,37(6):9-14
卷积神经网络是人体姿态估计中应用最成功的深度学习模型,但仍存在着一些诸如关节搜索空间过于巨大以及不同卷积核得到的抽象特征被平等对待等缺陷.为此,提出了一种基于改进卷积神经网络的人体姿态估计算法,利用先验分布减小关节搜索空间,改进卷积神经网络结构建立新的关节外观模型.改进的网络利用单个卷积核对应的全局和局部抽象特征计算关节的初始定位概率,通过对所有卷积核对应的关节初始定位概率进行线性组合来计算关节的最终定位概率,利用线性组合中不同的权值来体现不同抽象特征在定位关节时所起的不同作用.仿真实验表明,与现有基于卷积神经网络的人体姿态估计算法相比,所提出的算法具有更低的计算复杂度和更高的估计准确度.  相似文献   

15.
柯鹏飞  蔡茂国  吴涛 《计算机工程》2020,46(2):262-267,273
针对复杂卷积神经网络(CNN)在中小型人脸数据库中的识别结果容易出现过拟合现象,提出一种基于改进CNN网络与集成学习的人脸识别算法。改进CNN网络结合平面网络和残差网络的特点,采用平均池化层代替全连接层,使得网络结构简单且可移植性强。在改进CNN网络的基础上,利用基于投票法的集成学习策略将所有个体学习器结果凸组合为最终结果,实现更准确的人脸识别。实验结果表明,该算法在Color FERET、AR和ORL人脸数据库上的识别准确率分别达到98.89%、99.67%和100%,并且具有较快的收敛速度。  相似文献   

16.
大量结构无序、内容片面的碎片化信息以文本、图像、视频、网页等不同模态的形式,高度分散存储在不同数据源中,现有的研究通过构建视觉问答系统(visual question answering, VQA),实现对多模态碎片化信息的提取、表达和理解.视觉问答任务给定与图像相关的一个问题,推理相应的答案.在视觉问答任务的基本背景下,以设计出完备的图像碎片化信息问答的框架与算法为目标,重点研究包括图像特征提取、问题文本特征提取、多模态特征融合和答案推理的模型与算法.构建深度神经网络模型提取用于表示图像与问题信息的特征,结合注意力机制与变分推断方法关联图像与问题2种模态特征并推理答案.实验结果表明:该模型能够有效提取和理解多模态碎片化信息,并提高视觉问答任务的准确率.  相似文献   

17.
研究了一种基于深度置信网络的语音增强算法,并针对其不足做如下改进:考虑到对应训练集中噪声种类较少,噪声特性不够丰富的情况,在频域对噪声频谱进行扰动,以丰富噪声频谱特性;考虑到不同频点的信号对系统误差的影响不一样,结合绝对听阈构造权重系数。最后选取在噪声环境下传统语音增强算法中较好的LOG-MMSE和本文改进的基于深度置信网络的语音增强算法进行了分析比较,结果证明深度置信网络的语音增强算法显示出较好性能,尤其对增强后语音质量的提升超过了LOG-MMSE方法。  相似文献   

18.
在高速网络环境中,对复杂多样的网络入侵进行快速准确的检测成为目前亟待解决的问题。联邦学习作为一种新兴技术,在缩短入侵检测时间与提高数据安全性上取得了很好的效果,同时深度神经网络(DNN)在处理海量数据时具有较好的并行计算能力。结合联邦学习框架并将基于自动编码器优化的DNN作为通用模型,建立一种网络入侵检测模型DFC-NID。对初始数据进行符号数据预处理与归一化处理,使用自动编码器技术对DNN实现特征降维,以得到DNN通用模型模块。利用联邦学习特性使得多个参与方使用通用模型参与训练,训练完成后将参数上传至中心服务器并不断迭代更新通用模型,通过Softmax分类器得到最终的分类预测结果。实验结果表明,DFC-NID模型在NSL-KDD与KDDCup99数据集上的准确率平均达到94.1%,与决策树、随机森林等常用入侵检测模型相比,准确率平均提升3.1%,在攻击类DoS与Probe上,DFC-NID的准确率分别达到99.8%与98.7%。此外,相较不使用联邦学习的NO-FC模型,DFC-NID减少了83.9%的训练时间。  相似文献   

19.
由于中文词语缺乏明确的边界和大小写特征,单字在不同词语下的意思也不尽相同,较于英文,中文命名实体识别显得更加困难。该文利用词向量的特点,提出了一种用于深度学习框架的字词联合方法,将字特征和词特征统一地结合起来,它弥补了词特征分词错误蔓延和字典稀疏的不足,也改善了字特征因固定窗口大小导致的上下文缺失。在词特征中加入词性信息后,进一步提高了系统的性能。在1998年《人民日报》语料上的实验结果表明,该方法达到了良好的效果,在地名、人名、机构名识别任务上分别提高1.6%、8%、3%,加入词性特征的字词联合方法的F1值可以达到96.8%、94.6%、88.6%。  相似文献   

20.
"先使用,后付费"的营销方式导致电网公司电费回收不到位,难以支撑正常运转和获得基本效益。为了解决电力欠费对电网公司的不利影响,论文提出电力欠费预警智能预测的研究方法。将电费回收分为时间和金额两部分,结合相应的关联指标,建立参数自适应的深度信念网络,通过深度学习和训练对电力欠费情况精准预测。实验结果表明,与BP神经网络相比,深度信念网络更能准确预测出用户电费回收的未来情况,有效辅助电力企业制定用电和电费预警策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号