期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

袁文浩娄迎曦梁春燕王志强《西安电子科技大学学报(自然科学版)》2019,46(2):89-94

基于深度神经网络的语音增强模型的训练一般采用均方误差作为代价函数,没有针对语音增强问题进行优化。针对这一问题,从相邻帧网络输出之间的相关性和各时频单元的语音存在情况两方面进行考虑;通过在代价函数中对相邻帧的网络输出进行关联,并设计一个反映时频单元语音存在情况的感知系数,提出了一种感知联合优化的深度神经网络语音增强方法。实验结果表明,相比基于均方误差的语音增强方法,该方法显著地提高了增强语音的语音质量和可懂度,具有更好的语音增强性能。相似文献

2.

基于神经网络的麦克风阵列语音增强方法

赵光贾林飞王冬霞王琼《辽宁工学院学报》2005,25(3):146-148

描述了在诸如封闭环境的散射噪声场中，一种基于ADALINE神经网络的麦克风阵列语音增强方法。该方法充分利用了波束形成和神经网络的优点，对基于MLP-BP结构进行了改进，以提高神经网络的学习方法的收敛速度。仿真结果表明，和MLP-BP相比，该方法具有更好的噪声抑制性能。相似文献

3.

基于深度卷积神经网络的信息流增强图像压缩方法

李志军杨楚皙刘丹孙大洋《吉林大学学报(工学版)》2020,50(5):1788-1795

相似文献

4.

基于深度卷积循环网络的双通道语音增强算法

董桂官闫昭宇曾江蛟张丹丹《内蒙古科技大学学报》2022,(3):244-250

为提高针对手机通话应用场景中的双通道语音增强效果,使用深度卷积循环网络实现双通道语音增强算法,结合通道间的空间信息特征对模型进行改进,最后使用相位敏感掩蔽作为训练目标来修复相位损失.实验结果表明,改进方法可以提升网络对双通道信号的处理能力,得到语音质量和可懂度更高的双通道增强语音. 相似文献

5.

基于深度学习的语音门禁系统设计

张学祥吕文豪闻一波吴皓雷菊阳《上海工程技术大学学报》2020,34(3):253-257

基于深度可分离卷积神经网络(Depthwise Separable Convolutional Neural Network,DS-CNN)设计一个嵌入式离线语音门禁系统.系统首先利用深度学习库TensorFlow搭建DS-CNN声学模型并完成模型训练,然后将训练好的模型移植到嵌入式平台实现离线式语音识别,最后根据识别结果控制继电器执行相应动作.为避免人工设计的滤波器在特征提取时造成信息损失,系统采用语音信号的语谱图作为声学模型输入,通过多层卷积单元自动提取说话人语音特征进行分类判断,并引入语音唤醒机制,保证系统的安全性和低能耗.系统测试结果表明,该门禁系统1次识别成功率达95%以上,平均响应时间满足设计要求,具有较好的实用性. 相似文献

6.

基于量子神经网络(QNN)的语音增强技术

徐国标王伟李飞《军民两用技术与产品》2009,(1)

将量子神经网络(QNN)应用于语音增强技术中,并与基于径向基函数神经(RBF)网络的语音增强技术进行比较.实验结果表明,基于QNN上的语音增强技术效果比基于人工神经网络(ANN)中的RBF网络的语音增强技术效果好,消噪能力强,有更好的鲁棒性.另外,该技术还能够改善语音质量. 相似文献

7.

语音识别中深度神经网络目标值优化 总被引：1，自引：0，他引：1

陈梦喆张晴晴潘接林颜永红《四川大学学报(工程科学版)》2016,48(1):166-172

语音识别系统中,由强制对齐得到的用于训练深度神经网络声学模型的目标值,常常无法精准地表示出语音实际的情况,这是因为用于强制对齐的模型可能与处理语句不完全匹配,以及发音连续性导致的过渡边界难以分离等问题。针对这一问题,该文提出了一种利用前后向算法得到非0-1分布目标值的方法。新的目标值可以表示出某一帧以一定概率属于邻近各状态的分布情况,更详细地描述建模单元之间的过渡,进一步还原语音的原貌,提升模型的鲁棒性。同时,为寻求模型鲁棒性和建模单元区分度之间的平衡,对算法得到的目标值进行加窗处理。实验在中文客服问答领域上进行,在小数据量上验证了目标值对于训练的较大影响,并且选取了窗长宽度这一参数。最后将训练数据量提升至60小时,80小时以及100小时,结果显示新的目标值训练得到的模型在识别性能上获得了一致的提升,相对字错误率下降1.10%至3.65%。多组实验验证了新的目标值对模型训练有一定效果,在训练数据量上升的情况下依然具有有效性。相似文献

8.

基于深度学习的对话重叠语音片段检测

魏金太高穹《中北大学学报(自然科学版)》2021,42(1):34-39

为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频谱图进行端到端的学习.使用Fisher英语语料库的真实会话数据正确训练DCNN,同时保持并测试其对普通会话场景的普遍性.为了缓解严重的类失衡,在训练集中采取消除静音,并在训练过程中对占比重较多... 相似文献

9.

动态特征联合新掩模优化神经网络语音增强

梅淑琳贾海蓉王晓刚武奕峰《西安电子科技大学学报(自然科学版)》2021,48(3):91-98

针对神经网络语音增强算法因特征选取不能全面表示语音非线性结构导致语音质量较差的问题,提出一种动态特征联合新掩模优化神经网络语音增强的方法.首先,提取带噪语音的3种特征并进行拼接以得到静态特征,后求一阶、二阶差分导数,捕捉语音的瞬息信号,融合成动态特征,动静结合完成特征内部互补,减少语音失真.其次,为了使增强语音的可懂度... 相似文献

10.

基于双通道卷积注意力网络的语音增强方法

李辉景浩严康华邹波蓉侯庆华武会斌《河南理工大学学报(自然科学版)》2022,(5):127-136

传统的单通道网络模型因表征能力有限,无法充分提取语音深层特征,导致模型的语音增强效果不明显。鉴于此,提出一种双通道卷积注意力网络的语音增强方法。首先,使用卷积神经网络和长短时记忆网络构建并行的双通道学习模块,结合两种不同神经网络的优势,充分挖掘语音的深层特征;其次,在两个通道中分别添加注意力模块,依照关注度对通道的输出特征进行加权,达到强调有益信息的目的;最后,将两个通道的输出进行融合得到增强特征。结果表明,在低信噪比和非平稳噪声环境中,包含双通道结构和注意力模块的模型,其增强效果明显优于其他对比模型,有效提高了增强语音的质量和可懂度,验证了所提模型的可行性。相似文献

11.

Speech enhancement method based on the multi-head self-attention mechanism

CHANG Xinxu ZHANG Yang YANG Lin KOU Jinqiao WANG Xin XU Dongdong 《西安电子科技大学学报(自然科学版)》2020,47(1):104-110

The human ear can only accept one sound signal at one time, and the signal with the highest energy will shield other signals with low energy. According to the above principle, this paper combines the self-attention and the multi-head attention to propose a speech enhancement method based on the multi-head self-attention mechanism. By applying multi-head self-attention calculation to the input noisy speech features, the clean speech part and the noise part of the input speech feature can be clearly distinguished, thereby enabling subsequent processing to suppress noise more effectively. Experimental results show that the proposed method significantly outperforms the method based on the recurrent neural network in terms of both speech quality and intelligibility. 相似文献

12.

基于时频特征的卷积神经网络跳频调制识别

李红光郭英眭萍齐子森《浙江大学学报(工学版)》2020,54(10):1945-1954

针对人工设计特征表征能力不足,提取难度大的问题,提出基于卷积神经网络（CNN）的跳频信号调制方式识别系统. 该系统通过训练学习跳频信号时频图特征,将调制方式识别问题转化为图像识别问题. 采用组合时频变换方法对跳频信号进行时频变换得到二维时频图;经过自适应维纳滤波算法滤除背景噪声,提高系统抗噪性;采用连通域检测和双线性插值算法提取跳频信号每跳时频图,对时频图大小进行重置调整;将已处理的时频图输入到设计的11层卷积神经网络中进行训练学习,通过在输出层增加Softmax分类器,实现跳频调制方式分类识别. 仿真结果表明,该系统在信噪比为–4 dB条件下,对跳频信号BPSK、QPSK、8PSK、SDPSK、QASK、16QAM、32QAM和GMSK共8种调制方式的平均识别率达到92.54%. 相似文献

13.

基于LPMCC特征和小波RBF网络的语音识别

侯雪梅《西安邮电学院学报》2008,13(5):96-98

小波神经网络是结合小波变换理论与人工神经网络思想而构造出来的一种"新型的神经网络模型",融合了小波变换良好的时频局域化性质及神经网络的自学习功能。它通常可看作RBF网络的推广。本文构建了一个以Morlet母小波作为小波基,代替RBF网络中的激活函数的小波神经网络结构,并采用线性预测美尔倒谱(LPMCC)作为特征参数,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。相似文献

14.

一种基于深度神经网络的句法要素识别方法

陈艳平冯丽秦永彬黄瑞章《山东大学学报(工学版)》2020,50(2):44-49

为改进传统特征方法很难获取中文句子中结构信息的问题,提出一种基于深度神经网络的句法要素识别模型。采用Bi-LSTM网络从原始数据中自动抽取句子中的结构信息和语义信息,利用Attention机制自动计算抽象语义特征的分类权重,通过CRF层对输出标签进行约束,输出最优的标注序列。经过对比验证,该模型能有效识别句子中的句法要素,在标注数据集上F₁达到84.85%。相似文献

15.

基于全监督算法RBF神经网络的语音识别

侯雪梅《西安邮电学院学报》2011,16(1):87-90

利用RBF神经网络,采用全监督训练算法,实现基于RBF神经网络的抗噪语音识别系统。与传统的K-均值聚类算法相比较,采用全监督训练算法可避免隐含层节点中心容易对初始值敏感的缺点,且能使RBF网络具备更强的分类能力。实验结果表明,在不同的信噪比下,全监督训练算法比传统聚类算法有更高的识别率。相似文献

16.

基于深度卷积和自编码器增强的微表情判别

付晓峰牛力《浙江大学学报(工学版)》2022,56(10):1948-1957

为了判别微表情种类,提出基于深度卷积神经网络和迁移学习的微表情种类判别网络MecNet.为了提高MecNet在CASME Ⅱ、SMIC和SAMM联合数据库上的微表情种类判别准确率,提出基于自编码器的微表情生成网络MegNet,以扩充训练集.使用CASME Ⅱ亚洲人的微表情样本,生成欧美人的微表情样本.设计卷积结构实现图像编码,设计基于子像素卷积的特征图上采样模块实现图像解码,设计基于图像结构相似性的损失函数用于网络优化.将生成的欧美人的微表情样本加入MecNet训练集.实验结果表明,使用MegNet扩充训练集能够有效地提高MecNet微表情种类判别准确率.结合MegNet、MecNet的算法在CASME Ⅱ、SMIC和SAMM组成的联合数据库上的表现优于大部分现有算法. 相似文献

17.

基于PID神经网络的拉深件变压边力控制方法研究

屈晓阳展培培杨嵩赵军《东北重型机械学院学报》2011,(4):309-313,318

将传统的PID控制器与神经元网络融合,建立PID神经网络。运用VB语言编译了拉深过程中变压边力控制系统的PID神经网络仿真程序,并与传统的PID控制仿真进行了对比。建立了基于PIDNN的变压边力控制系统,并通过锥形件拉深实验,证实了PIDNN控制系统具有精度高,抗干扰能力强,能较准确达到变压边力控制要求等优越性。为后续的变压边力控制系统实验研究与工厂实际应用提供了理论与实践基础。相似文献

18.

采用卷积自编码器网络的图像增强算法

王万良杨小涵赵燕伟高楠吕闯张兆娟《浙江大学学报(工学版)》2019,53(9):1728-1740

将图像增强方法低光网络（LLNet）应用于实际场景下的彩色图像时会产生大量冗余参数,为此基于LLNet提出卷积自编码器网络（CAENet）的图像增强方法. 将LLNet方法中的低光处理模块与网络训练衔接在一起;采用卷积网络代替传统自编码器的编码和解码方式. 实验结果表明：CAENet能够有效节约时间成本,减少网络参数,使网络训练更加高效,得到更好的图像低维表示. 在Corel5k数据集上的实验效果表明,CAENet在减少网络参数的同时,能有效提高图像光感和色感;在高分辨率数据集上的实验结果表明,针对图像细节方面,CAENet能够保留细节不失真;针对含噪低光图像,CAENet能在增强图像的同时达到去噪的效果,证明CAENet具有较强的鲁棒性. 相似文献

19.

基于六维前馈神经网络模型的图像增强算法

张宪红张春蕊《山东大学学报(工学版)》2018,48(4):10-19

针对滤波去噪对边缘造成的弱化、部分采集图像不清晰以及对比度低的问题,在充分分析模型的动力学性质的基础上,提出一种基于六维前馈神经网络模型的图像增强算法。试验表明:基于六维前馈神经网络模型的图像增强算法可以更好地达到图像增强效果。与其它几种增强算法相比,增强效果清晰,且算法更优。相似文献