期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李战明苏敏赵正天李二超《电声技术》2007,31(12):44-46,50

基于隐马尔可夫模型(HMM)和改进后的概率神经网络(PNN)模型提出了一种用于语音识别的混合模型,该模型首先利用HMM生成最佳语音状态序列,然后对最佳状态序列进行时间规整,最后通过PNN神经网络进行分类识别。给出了HMM参数训练及时间规整的算法。实验结果表明这种模型比HMM具有更好的识别效果。相似文献

2.

基于小波网络和HMM的语音识别方法

刘维亭朱志宇《电声技术》2004,(11):56-59

利用隐马尔可夫模型(HMM)的动态时间序列建模能力及神经网络的模式分类能力,构成混合语音识别模型,同时考虑到语音信号的非平稳性,采用小波分析方法提取语音特征向量。通过时间规整方法,将所有具有可变长度的语音特征向量转换为相同维数的特征向量,从而简化了神经网络的结构。仿真结果表明,采用混合语音识别模型以及时间规整方法,不仅可提高识别率,同时大大缩减了训练时间,获得了很好的识别效果。相似文献

3.

改进的LVQ网络与DTW相结合的语音识别方法

吴金南宫宁生《微电子学与计算机》2009,26(5)

提出一种基于动态时间规整(DTW)和改进的学习矢量量化(LoPLVQ)的神经网络的语音识别方法.该方法用动态时间规整算法先对语音信号进行时间规整,然后通过改进的学习矢量量化神经网络进行语音的分类识别.实验表明,新系统在大规模语音识别方面不仅能缩短训练时间,而且具有较高的识别率. 相似文献

4.

改进的高效动态时间规整算法语音识别系统

王新胜巩捷甫喻明艳《太赫兹科学与电子信息学报》2015,13(6):942-946

动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。相似文献

5.

英语语音优化识别建模仿真分析

《信息技术》2019,(6):91-95

随着中国经济高速发展以及全球一体化的进程,英语成为了人们日常交流必不可少的工具,然而对于初学者来说,能够通过语音识别技术将语音信号转化成文本的格式,更有利于快速掌握英语。而且语音识别技术经过多年的发展依然具有巨大的挖掘潜力,面对移动互联网的快速发展,通过对实时通信工具的大数据量的需求爆发,英语语音识别的实时性和系统稳定性越来越受到关注,文中分析了常用的传统语音识别技术,例如动态时间规整、神经网络模型和隐马尔可夫模型等,运用隐马尔可夫模型对语音信号进行处理和识别,提取出特征参数,与经过训练的模型体系进行匹配,找出最优的识别序列。然后在PC平台上,利用MATLAB建模仿真,基本实现了英语语音短句的识别,对于后续的硬件产品实现打下了良好的基础,具有积极的现实意义。相似文献

6.

基于Matlab/RTW的语音识别及无线控制系统

孙德民何鹏举《今日电子》2010,(10):49-50,58

语音识别是近年来十分活跃的一个研究领域,被广泛应用于工业控制、智能家居、医疗、高端家电等多个领域。根据识别的对象不同,语音识别可分为孤立词识别、关键词识别和连续语音识别。目前用于语音识别的方法有基于动态时间规整（DTW）技术的模板匹配法、基于概率统计的HMM法和基于人工神经网络的最优搜索法。相似文献

7.

基于PCNN和DTW的语音识别系统设计

张晓俊陶智顾济华赵鹤鸣施晓敏《通信技术》2007,(4):60-62

提出了一种基于脉冲耦合神经网络(PCNN)和动态时间规整(DTW)的语音识别方法。首先利用改进后的PCNN提取语谱图图像特征作为语音的特征参数,然后通过DTW来进行语音分类识别。实验表明,论文中所提出的方法与传统的LPCC和MFCC方法相比,所需特征参数量减少约40%,并能达到87.5%识别率,利于系统的硬件实现。相似文献

8.

语音识别中动态时间规整算法的硬件加速实现

祝禛天焦继业刘泽琛《电子设计工程》2022,30(7):21-25

动态时间规整算法(Dynamic Time Warping,DTW)是语音识别中常用的技术之一.为了提升因数据量增加以及算法对数据的高度依赖性所导致的计算性能降低,提出一种针对语音帧的动态时间规整算法硬件架构.识别计算过程中,通过使用算法时间复杂度相对低的下界距离函数(Lower Bound Function,LBF)... 相似文献

9.

基于改进神经网络的三字词声调识别方法

郑燕琳许星宇杨晓炯《电声技术》2010,34(5):48-51

汉语连续语音三字词声调由于受声道响应、音连、变调规律等的影响,情况较复杂,声调模式间交集大,模糊性强。提出了一种基于动态时间规整和改进神经网络的声调识别算法。实验表明,该算法可得到较好的识别效果,对探讨具有汉语特色的新的语音识别方法有重要意义。相似文献

10.

有序聚类方法及其在神经网络语音识别中的应用 总被引：3，自引：1，他引：2

史笑兴顾明亮王太君何振亚《电路与系统学报》2000,5(2):99-103

本文提出了一种新的网络结构,我们称之为有序聚类网络。这种网络能够对语音信号进行特征提取,很好地解决神经网络语音识别中的时间规整问题。有序聚类网络从输入语音信号的特征矢量序列中撮出一组固定数目的特矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化经分类器的网络产高的识别率。根据该们建立了相似文献

11.

语音识别中的神经网络DTW结构 总被引：1，自引：0，他引：1

李海洲徐秉铮《电子学报》1992,20(10):82-87

本文介绍语音识别中一种基于动态规划技术的时间规正算法DTW的神经网络实现方法.DTW是语音识别中最为有效的方法之一,它具有较强的鲁棒性且为语音识别系统提供了可能的最高识别率.但由于其计算量太大,除非用专门的硬件,DTW算法在实现时受到了限制.在本文中,所有的计算是由两个循环神经子网和一记忆层来完成的,该方法展示了算法的硬接线结构,(hard-wiring)的优越性,这为DTW的硬件实现提供了一种新的实施策略. 相似文献

12.

基于LPMCC的语音识别系统实现

石太佳王晓君《电声技术》2010,34(1):63-66

语音识别可实现人机交互和语音控制,在工业控制、消费电子等领域都有广泛应用。结合人发音的生理结构的特点,使用LPMCC（LPC倒谱美尔变换）作为特征向量,采用动态规划算法作为核心识别算法,在TMS320VC5402芯片上实现了特定人、孤立词的高性能实时识别系统。相似文献

13.

基于耦合的混沌神经网络建模方法 总被引：3，自引：0，他引：3

韩明虎余英林《通信学报》1995,16(2):13-19

混沌状态下神经网络行为的研究是神经网络理论的一个新内容，由于它可能揭示脑活动的深层机制而广受重视，但是混沌网络信息处理能力进行大量和深入研究却遇到许多障碍，其问题之一是难以为网络系统选择适当的非线性参数。本文提出一种建立混沌神经网络模型的简单耦合方法，解决了选择参数的困难，计算机模拟结果表明，用该模型研究混沌状态下网络动态行为是有效的。相似文献

14.

Introduction to the modified probabilistic neural network forgeneral signal processing applications

Zaknich A. 《Signal Processing, IEEE Transactions on》1998,46(7):1980-1990

This paper introduces a practical and easy-to-understand network for signal processing called the modified probabilistic neural network (MPNN). It begins with a short introduction to the application of artificial neural networks to signal processing followed by a background and review of the MPNN theory. The MPNN is a regression technique similar to Specht's (1991) general regression neural network, which is based on a single radial basis function kernel whose bandwidth is related to the noise statistics. It has advantages in application to time and spatial series signal processing problems because it is constructed directly and simply from the training signal waveform characteristics or features. An illustrative example involving noisy Doppler-shifted swept frequency sonar signal detection compares the effectiveness of the first- and second-order Volterra, multilayer perceptron neural network, radial basis function neural network, general regression neural network and MPNN filters, demonstrating some features of the MPNN for practical design 相似文献

15.

神经网络在缺陷识别中的应用

董剑龙徐美芳《山西电子技术》2005,(6):24-25,42

为了准确、快速地进行缺陷识别，介绍了一种新型的前馈神经网络模型，即径向基概率神经网络。与以往的算法相比，该方法具有分类识别精度高且速度快的优点。仿真获得了很好的结果。相似文献

16.

基于时空推理网络的空中红外目标抗干扰识别算法

下载免费PDF全文

张良田晓倩李少毅杨曦《红外与激光工程》2022,51(7):20210614-1-20210614-10

复杂空战背景下的抗红外诱饵干扰技术是红外空空导弹的核心技术之一。针对传统静态贝叶斯网络不能表达序列图像中特征变量在时序上动态变化关系,提出了一种符合人类视觉推理识别过程的时空关联推理网络抗干扰识别算法。首先,提出的时空关联推理网络在考虑特征空间约束关系的基础上,引入了特征变量时间约束的先验知识,建立表达特征时空关联的目标推理网络识别模型,从而增强了序列图像目标识别的稳定性;其次,通过仿真数据构建样本集,离线训练学习时空关联推理网络结构及特征跳转概率参数,确定概率推理网络识别离线模型;最后,依据测试数据,结合推理识别网络模型进行概率推理,实现对目标的识别分类。实验结果表明,在伴随红外诱饵干扰投放的条件下,基于时空关联推理网络的抗干扰识别率达到94%,比静态贝叶斯网络抗干扰识别算法高3%,有效提升了目标识别的稳定性。相似文献

17.

基于人工智能的跨媒体感知与分析技术研究

李斌张正强张家亮周世杰刘建新《通信技术》2020,(1):131-136

随着新媒体技术的飞速发展,传统方法已难以准确表达具有人工智能属性的复杂知识结构,跨媒体成为大家关注的焦点。当前,媒体数据感知与分析已经从文本、语音、图像以及视频等单一媒体形态向覆盖网络空间与物理空间的跨媒体融合转变。研究满足新一代人工智能发展规划的跨媒体感知和分析技术体系,并依托知识图谱、长短时记忆网络以及卷积神经网络等技术,实现多通道网络数据爬取、实体统一表征、文本语义识别以及视图像分类等,可有效支撑舆情分析、新闻追踪以及情报获取等领域的跨媒体应用。相似文献

18.

Automatic target recognition using a feature-decomposition anddata-decomposition modular neural network

Lin-Cheng Wang Der S.Z. Nasrabadi N.M. 《IEEE transactions on image processing》1998,7(8):1113-1121

A modular neural network classifier has been applied to the problem of automatic target recognition using forward-looking infrared (FLIR) imagery. The classifier consists of several independently trained neural networks. Each neural network makes a decision based on local features extracted from a specific portion of a target image. The classification decisions of the individual networks are combined to determine the final classification. Experiments show that decomposition of the input features results in performance superior to a fully connected network in terms of both network complexity and probability of classification. Performance of the classifier is further improved by the use of multiresolution features and by the introduction of a higher level neural network on the top of the individual networks, a method known as stacked generalization. In addition to feature decomposition, we implemented a data-decomposition classifier network and demonstrated improved performance. Experimental results are reported on a large set of real FLIR images. 相似文献