共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
本文介绍了一种基于TMS320C6711 DSP的非特定人、孤立词语音识别系统。本文首先介绍了语音识别技术的基本原理,然后对不同的识别算法在多种嵌入式系统平台上进行性能分析和比较,可得到本语音识别系统具有较高的识别率、实时性和鲁棒性。 相似文献
3.
简要总结回顾了近十几年来脉冲耦合神经网络(简称PCNN)理论的发展及应用现状,对PCNN在国内外的主要研究方向和主流应用领域予以梳理,内容安排如下:首先简要、系统地概述PCNN的起源、模型及特性,然后分析讨论了PCNN理论发展及其应用研究,特别是首次概括了近年来PCNN在语音处理领域的研究成果,并在文章最后展望PCNN未来发展前景。 相似文献
4.
介绍特定人大词汇量语音识别的单音训练,词汇识别邓在识别时进行词汇识别,样本训练时采用单音训练,实验证明,该方法样本训练工作量小,识别正确率高。 相似文献
5.
提出了一个柔性可扩展体系结构非特定人语音识别系统的框架模型,介绍了相关实现原理。讨论了该模型的体系结构、通信接口及逻辑流程,并于实践中验证了在该模型指导下所开发出的应用系统的实用性和稳定性,具有一定的参考价值。 相似文献
6.
7.
SOM结合MLP的神经网络语音识别系统 总被引:2,自引:0,他引:2
提出一种结合自组织特征映射(Self-organizingFea-tureMap,SOM)和多层感知器(MultilayerPerceptron,MLP)的神经网络语音识别系统,该系统有较好的识别效果 相似文献
8.
语谱图是语音信号的时频表示,含有丰富的信息。把语谱图输入到脉冲耦合神经网络(PCNN)可以获得语音的特征矢量。传统的语音特征采用PCNN50次迭代的点火次数。提出了一种新的语音特征参数,该参数基于PCNN神经元点火位置的信息。说话人识别的实验表明,新语音特征比传统的特征更能反映话者语音信号的特点,获得更好的识别结果。 相似文献
9.
噪音环境下的语音识别一直是语音识别的难点,本文采用了谱减法进行去噪,进行孤立词(数字0-9)的识别,提高系统的识别率 相似文献
10.
神经网络是近年来信息科学、脑科学、神经心理学等诸多学科共同关注和研究的热点.由于其具有良好的抽象分类特性,现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具.文章在讲述语音识别过程的基础上重点讨论利用BP神经网络对语音进行识别,用MATLAB完成对神经网络的训练和测试,并获得满意的结果. 相似文献
11.
传统的弹簧卡箍缺陷多为产后人工全检,存在漏检与缺陷率上升等现象,这不但会使成本上升、也对人力资源提出了考验;为此实现自动实时在线全检就成为急需解决的课题,设计了基于机器视觉的弹簧卡箍在线自动检测系统,该系统安装在弹簧卡箍流水线两侧,搭建特定光源,通过激光传感器外部触发工业相机对其表面进行图像捕获,送上位机进行缺陷判定与定位,最后通过RS485将判定结果送下位机来控制剔除机制;实验结果显示:该系统采用改进的脉冲神经网络(PCNN)能准确提取目标缺陷区域并对缺陷进行判定,可在0.348s每个零件的速度下,检测出弹簧卡箍表面大于10像素的缺陷;通过对不同弹簧卡箍进行检测验证实验,证明了PCNN算法对缺陷分割的准确性和有效性。 相似文献
12.
13.
侯雪梅 《计算机工程与应用》2009,45(19):150-152
针对目前在噪音环境下语音识别系统性能较差的问题,利用小波神经网络融合了小波变换良好的时频局域化性质和RBF神经网络具有最佳分类能力和辨识能力等特性。构建了一个用小波基替代RBF网络中激活函数的小波-RBF神经网络结构,并采用全监督训练算法,实现了基于小波-RBF网络的抗噪语音识别系统。实验结果表明该系统比RBF网络具有更好的识别效果,尤其在噪声环境下,具有更强的鲁棒性。 相似文献
14.
对话行为可以在一定程度上表达说话人的意图,对话行为分类是机器翻译、人机交互设计等领域的基本要求,对于语音识别领域具有重要的意义.针对噪音环境下的对话行为分类提出了一种新的模型,通过快速噪声估计谱减法进行语音增强,采用长短期记忆网络对经过卷积神经网络语言嵌入后的词向量进行学习,从而得到具有抗噪性的对话行为分类模型.使用中文日常用语语料库的样本进行了多组对比试验,以测试新模型的抗噪声能力和对话行为分类的准确性.结果表明在0 dB的噪声环境下,模型的对话行为分类准确度达到95.5%,当噪声增加到5 dB时仍能保持94.1%,为噪音环境下的对话分类提供了一种新的模型. 相似文献
15.
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。 相似文献
16.
针对图像骨架毛刺去除的过程中图像骨架的几何结构很难保持完整的问题,提出了基于脉冲耦合神经网络(PCNN)图像骨架毛刺去除方法.该方法根据图像的性质对PCNN进行了改进,并定义了骨架中的端点、交叉点等概念.根据PCNN对应神经元同步激发而产生脉冲的传播特性,判断和除去骨架上的毛刺.仿真结果表明,该方法不仅能完整而准确的反应目标图像的几何结构,而且具有很强的抗干扰和去噪能力. 相似文献
17.
18.
为了更好地对CT和MRI图像进行融合,提出了一种指数型模糊加权熵自适应融合规则和改进的PCNN区域信息融合规则在多小波基的框架下进行CT和MRI医学图像的融合方法。对待融合图像进行多小波基的分解,对不同频率分量采用不同融合算法。实验表明,算法明显优于其他融合算法。它提高了图像的清晰度,较大程度保留了细节信息,具有边缘信息突出,亮度对比度高的优点。 相似文献
19.