首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
为实现音视频语音识别和同时对音频视频流进行准确的音素切分,该文提出一个新的多流异步三音素动态贝叶斯网络(MM-ADBN-TRI)模型,在词级别上描述了音频视频流的异步性,音频流和视频流都采用了词-三音素-状态-观测向量的层次结构,识别基元是三音素,描述了连续语音中的协同发音现象.实验结果表明:该模型在音视频语音识别和对音频视频流的音素切分方面,以及在确定音视频流的异步关系上,都具备较好的性能.  相似文献   

2.
陈雁翔  刘鸣 《电子学报》2010,38(12):2920-2924
 人类对语音的感知是多模态的,会同时受到听觉和视觉的影响.以语音及其视觉特征的融合为研究核心,依据发音机理中揭示的音视频之间非同步关联的深层次成因,采用多个发音特征的非同步关联,去描述表面上观察到的音视频之间的非同步,提出了一个基于动态贝叶斯网络的语音与唇动联合模型,并通过音视频双模态的多层次融合,实现了说话人识别系统鲁棒性的提高.音视频双模态数据库上的实验表明了,在不同语音信噪比的条件下多层次融合均达到了更好的性能.  相似文献   

3.
步态识别在生物识别中研究日益增多。目前对步态的识别研究大都是考虑单一条件下步态的识别率,但在穿外套、背包等混合条件下识别率较低,该文分析了人体行走时步态的时序特征,提出一种4层的双尺度多信息融合的动态贝叶斯网络。模型中每个时间片都为整体信息即大尺度信息和局部细节信息即小尺度信息的融合。此模型能很好地表达步态的时序特性,即步态行走时人体姿态,运动幅度等特征的节奏性变化。实验结果表明该方法有较高的识别率,能有机地融合步态的整体信息及局部细节信息,并且在有轮廓噪声及信息缺失的情况下有较好的鲁棒性,大大降低了外套及背包对步态识别的影响。  相似文献   

4.
基于模糊贝叶斯网络的空中目标多传感器融合识别研究   总被引:3,自引:1,他引:2  
为了对充满不确定性与模糊性的空中目标识别数据进行处理,提高空中目标多传感器融合的准确性和可靠性,提出以模糊贝叶斯网络为基本结构的多传感器数据融合模型.该模型能够对清晰连续变量通过模糊化和去模糊化操作变换成离散变量,而且基于模糊贝叶斯网络的建模方法能够组合多种证据进行不确定性表达和推理.通过详细分析空中目标识别的推理规则,建立了空中目标识别的贝叶斯网络拓扑结构,提出了贝叶斯推理算法对多种证据进行融合计算的模型.识别实例表明该模型能够融合不同信息源的数据,有效地提高空中目标识别的效率.  相似文献   

5.
王洪泊  涂序彦 《电子学报》2011,39(6):1331-1335
将面向最经济服务的流演算机制引入到动态贝叶斯网络结构的学习中,提出一种面向最经济服务流的可视化动态贝叶斯网络分解协调模型(SFO-DBNs)及具体实现算法;该算法把Ford-Fulkerson流分解算法推广到多源、多汇的情况下,并加入了时间片t因素对服务流稳定性约束,可以把一个描述复杂大系统流演算的贝叶斯网络动态协调分...  相似文献   

6.
应用贝叶斯网络理论在解决不确定性事件方面的推理优势于空袭兵器的识别,充分结合空袭兵器识别上的现有经验,结合图形模式推理,最大限度地提高空袭兵器识别的准确性,实现空袭兵器的自动识别.  相似文献   

7.
多信源ATM分组语音图像流的分析   总被引:1,自引:0,他引:1  
舒斐  孙立宏  李欣  张顺颐 《数字通信》2000,27(3):4-5,58
分析了ATM复用器中的分组语音图像流.为研究多信源、大流量条件下的流量特性,我们将语音源近似为马尔柯夫泊松过程MMPP(2).2个泊松过程的平均到达率由生灭链得出,转移率则通过极限定理,由高斯过程的矩匹配MMPP(2)相应参数而获得.同时,我们运用流体流法来解决复用缓冲性能.同样的方法适用于图像源及语音图像合成源的情况.  相似文献   

8.
针对空战战场环境下的目标可靠识别,提出了基于动态贝叶斯网络的战斗目标综合推理识别方法.分析了目标属性的多层次及状态变量关系,提出了层次化的战斗识别动态贝叶斯网络拓扑结构及其参数设定方法,并运用时间片联合树算法进行不确定性动态推理,实现动态的目标属性判断与识别.仿真结果给出了目标的多层次属性信息,验证了模型的有效性.  相似文献   

9.
基于云计算可实现分布式并行程序海量数据处理的特点,提出将多传感器目标识别融合处理部署在云计算Hadoop平台上,并将其运行在多个节点组成的计算机集群上。根据目标识别原理建立贝叶斯网络结构,对目标识别预处理得到的数据进行融合计算,推理目标类型,并对不同情况下的Hadoop集群效率进行分析比对。实验结果证明了将目标识别融合处理部署在云计算平台上可有效提升运算效率。  相似文献   

10.
徐亮  王晶  杨文镜  罗逸雨 《信号处理》2021,37(10):1799-1805
视听多模态建模已被验证在与语音分离的任务中性能表现优异,本文提出一种语音分离模型,对现有的时域音视频联合语音分离算法进行改进,增强音视频流之间的联系。针对现有音视频分离模型联合度不高的情况,作者提出一种在时域上将语音特征与额外输入的视觉特征进行多次融合,并加入纵向权值共享的端到端的语音分离模型。在GRID数据集上的实验结果表明,该网络与仅使用音频的时域语音卷积分离网络(Conv-TasNet)和音视频联合的Conv-TasNet相比,性能上分别获得了1.2 dB和0.4 dB的改善。   相似文献   

11.
噪声自适应的多数据流复合子带语音识别方法   总被引:3,自引:0,他引:3  
张军  韦岗 《电子与信息学报》2006,28(7):1183-1187
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。  相似文献   

12.
递归神经网络(Recurrent Neural Network, RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition, ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model, HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。  相似文献   

13.
语音识别隐马尔可夫模型的改进   总被引:7,自引:1,他引:6  
由于在语音识别中被广泛应用的隐马尔可夫模型是一重马尔可夫模型,它不能充分地描述语音信号的时间相依性。虽然理论上可将HMM扩展成多重马尔可夫模型,但由于所需运算量和存储量将成指数增长而使其难以应用。因此,本文提出一种新模型,它是由HMM与一个能描述语音信号时间相依性的多维高斯密度函数相结合构成的。本文从理论上论证了新模型的合理性。对汉语不计声调的全部409个单音节的识别实验结果表明:新模型的识别率显  相似文献   

14.
基于电话用户交换机的语音识别系统研究   总被引:3,自引:0,他引:3  
本论文对电话用户交换机研制了一个声控语音命令交换系统,该系统能够实现与特定人无关中小词汇量连续命令语音自动识别,研究中统计了用和命令语句,生成相应识别文法网络,识别系统的训练采用由子词模型构成的复合模型进行强化训练,识别采用令牌传递式改进Viterbi算法,提高系统的识别性能,论文比较了不同语音特征参数以及隐含马尔可夫模型状态数对电话语音识别精度的影响,研究中还开发识别系统拒识系统,在无拒识情况下  相似文献   

15.
HMM在语音识别系统中的应用   总被引:1,自引:0,他引:1  
介绍语音识别技术的应用状况与发展,对基于动态时间伸缩技术、隐含马尔科夫模型及人工神经网络的3种不同的语音识别系统进行了比较,重点介绍了隐含马尔科夫模型(HMM)在语音识别系统中的应用。其中基于HMM的语音识别系统是在UniSpeech芯片上实现基于DHMM的识别系统,然后又在同一平台上实现了基于CHMM的识别系统。  相似文献   

16.
通常采用具有前向连接权的连接网络便可实现静态输入输出模式对的联想,但是为了使网络记忆序列信息状态,必须考虑引入反馈连接权。本文构造一个具有动态神经元的多层网络结构,动态神经元带有多时延的局部反馈。此网络结构用于记忆时间序列信息,同时,相应地我们推导一种更有效、更便于实现的网络学习算法。最后,为了测试所提出网络学习动态时变数据的能力,选择几个不同参数的动态神经元模型,进行了一系列实验。  相似文献   

17.
本文在文献(1)建立的外周听觉系统以及部分中枢听觉神经系统的基础上,建立了一个主意识别器。它由听觉模型作为语音声学前端处理器(即特征提取),由具有tonotopic组织结构的神经网络作为识别分类器。大量实验表明,由该听觉模型提取的特征参数不仅能很好地表示主意区别意义,而且对于噪声环境下的语音特征表示有较好tobustness。语音识别实验表明:在有噪声的情况下,采用听觉模型参数的识别器,其识别率明  相似文献   

18.
基于DTW算法的语音识别电话系统   总被引:2,自引:0,他引:2  
介绍了动态时间伸缩算法在语音识别电话系统中的应用。阐述了语音识别电话系统的硬件结构及算法在该系统的实现过程。  相似文献   

19.
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。这种方法免去了繁重的人工标注工作,避免了标注错误。实验表明,将'VisemicLDA视觉特征引入到听视觉语音识别中,可以大大地提高噪声条件下语音识别系统的识别率;将这种视觉特征与多数据流HMM结合之后,在信噪比为10dB的强噪声情况下,识别率仍可以达到80%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号