首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
为了有效利用不同关键词检测系统的互补性,解决不同系统检测结果置信度得分不在同一范围的问题,提出了一种基于得分规整和系统融合的语音关键词检测方法。首先,为了克服连续语音识别系统中因剪枝错误而引起的关键词丢失问题,应用了关键词相关的软Beam宽度剪枝策略裁剪词图;其次,在系统融合前采用得分归一化方法,使得不同系统关键词检测结果置信度得分在同一范围;最后,通过系统融合处理将不同系统的关键词输出进行整合,得到最终的关键词检测结果。实验结果表明,经过得分归一化处理后,关键词检测性能的实际查询词权重代价(Actual term-weighted value, ATWV)平均相对提升30%;系统融合后关键词的检测性能,相比于得分归一化处理后的最佳单一系统,得到了10%的提升。  相似文献   

2.
一种基于多层背景模型的前景检测算法   总被引:4,自引:0,他引:4       下载免费PDF全文
动态场景中的前景检测是后继处理的基础和制约整个智能视频监控系统稳定性、可靠性的关键。为了在保证运动目标检测的基础上,进一步检测出前景中的静止目标并消除"鬼影(Ghost)",提出了一种基于多层背景模型的前景检测算法。该算法将背景分为参考背景和动态背景两层,分别采用单高斯和混合高斯模型进行背景建模。在线检测时,采用动态背景提取变化前景,用动态背景与参考背景之间高斯分布的差异提取静止前景,同时,通过逐层分析,比较输入像素与两层背景模型分布的相互关系,快速消除Ghost,降低虚警。实验结果表明,多层背景模型具有良好的检测性能和实时性,为后继跟踪、分类等处理提供了坚实的基础。目前,以该算法为核心构建了一个实时目标检测、跟踪系统,对图像大小为320×240的视频序列的平均处理速度达到15帧/s。  相似文献   

3.
固定摄像机目标提取多以高斯混合模型为背景模型,在检测运动缓慢、间歇停滞的目标时会出现前景目标空洞的问题。为此,提出一种能够适应目标间歇停滞的多模型协同目标提取方法。采用高斯混合模型进行背景学习,通过光线检测模型和场景状态检测模型协同控制背景适时更新,利用阴影检测模型剔除阴影。实验结果表明,与KaewTraKulPong P方法相比,该方法能较完整地提取到目标轮廓,且单帧处理时间较少。  相似文献   

4.
袁宝峰  吴乐华  曾伟 《计算机工程》2010,36(11):180-182
针对树叶飘落、树枝摇动等自然背景的变化对目标检测带来的影响,提出一种结合分形维的高斯混合模型(GMM)目标检测方法。利用差分盒子维求取图像分形维数,通过设定分形维阈值去除自然背景,采用GMM方法进行目标检测。结果证明,该方法比传统的目标检测方法具有更好的检测效果。  相似文献   

5.
运动目标检测是视频处理的基础,而目标的阴影在很大程度上影响了目标的真实形状,干扰了真实目标的检测。本文提出了一个以混合高斯模型为基础,结合多特征的运动目标检测方法。将阴影消除算子、帧差、方差及彩色信息融合到背景模型中,能较准确地检测运动目标并消除阴影的影响。  相似文献   

6.
针对传统混合高斯模型(GMM)前景目标检测运算量过大问题,提出一种基于改进混合高斯模型的前景检测算法(TGM)。通过基于历史信息的模型清理机制,减少背景稳定区域像素点的高斯分布数量,进而降低算法运算量;建立临时高斯分布,运用更简单的加减运算进一步减少运算量,最后将符合条件的临时高斯分布转化为正式高斯分布,避免模型无意义的频繁更新,提高了准确性。实验结果表明,改进后的算法与原算法相比,具有更好的实时性和很好的准确性。  相似文献   

7.
新颖检测中,可应用高斯混合模型建立已知数据模型,拟合数据分布,但当数据维数较高时,自由参数太多,训练需要巨大的数据采样,而ICA搜寻数据的最大统计独立表示,可以将数据从高维空间投影到低维空间。提出一种基于ICA空间高斯混合模型的新颖检测,可有效减少估测的自由参数,降低训练数据采样的苛刻要求,实验也验证了该方法的可行性。  相似文献   

8.
一种基于改进码本模型的快速运动检测算法   总被引:3,自引:0,他引:3  
从视频序列中分割出运动目标是计算机视觉应用领域中一个基础和关键的任务.针对现有码本模型(codebook model)在RGB颜色空间下不能很好地契合其计算特性,且无法兼顾抗扰动能力和分割质量的问题,提出一种基于改进码本模型的快速运动检测算法.首先将像素从RGB空间转换到YUV空间来建立码本模型;然后单独对每个码字中的亮度分量进行单高斯建模,使得整个码本具有高斯混合模型(Gaussian mixture model)的特性.典型测试序列和扰动检测率(perturbation detection rate)曲线的对比实验表明,该算法是高效和实用的.  相似文献   

9.
给出一种适用于在线垃圾模型的基于动态排位信息的关键词确认方法,利用识别过程中声学得分的排位信息进行关键词确认,能在不降低检出率的同时有效降低系统的误警率,效果优于同类方法。该方法不依赖于具体的关键词表,计算简单,能够应用于实际工程中。  相似文献   

10.
针对定性工业供应链销售预测方法中存在的精度低、非智能化且无法处理复杂样本等问题,提出一种基于高斯混合模型的工业供应链销售预测方法.分析真实销售数据的特征信息及特征间的相关程度;在不同聚类簇数和特征数的组合下利用训练数据集迭代计算模型参数;对测试数据集进行销售预测,通过比较预测结果的准确率、召回率和F值三个指标确定可实现...  相似文献   

11.
针对关键词检出系统中计算观察概率效率较低的问题,在最近邻近似方法的基础上,提出一种基于相邻帧特征相似性的方法。依据相邻帧之间的高相似性,利用产生前一帧特征矢量的若干个最大的混合分量,有效预测当前帧所使用的最大高斯混合分量,从而快速计算观察概率。实验结果表明,与基线系统相比,该方法在保持识别性能的前提下,识别时间可降低29.3%。  相似文献   

12.
针对单目视觉机器人的定位问题,提出了一种基于EM(expectation maximization algorithm)的混合高斯粒子滤波定位算法。采用高斯混合模型矢量量化的方法生成图像直方图,利用图像特征相似性度量方法对提取的图像直方图进行匹配,并将匹配的结果应用到粒子滤波定位中,实现了室内结构化环境下机器人的全局定位。仿真实验结果表明颜色特征提取方法和机器人定位方法的有效性。  相似文献   

13.
刘宇鹏  李生  赵铁军 《自动化学报》2010,36(11):1575-1580
最近混淆网络在融合多个机器翻译结果中展示很好的性能. 然而为了克服在不同的翻译系统中不同的词序, 假设对齐在混淆网络的构建上仍然是一个重要的问题. 但以往的对齐方法都没有考虑到语义信息. 本文为了更好地改进系统融合的性能, 提出了用词义消歧(Word sense disambiguation, WSD)来指导混淆网络中的对齐. 同时骨架翻译的选择也是通过计算句子间的相似度来获得的, 句子的相似性计算使用了二分图的最大匹配算法. 为了使得基于WordNet词义消歧方法融入到系统中, 本文将翻译错误率(Translation error rate, TER)算法进行了改进, 实验结果显示本方法的性能好于经典的TER算法的性能.  相似文献   

14.
王晶 《信息与控制》2012,41(2):220-224,232
针对难以建立较准确数学模型的非线性被控对象,提出了一种基于神经网络的数据驱动控制器参数整定法.其设计思想是结合虚拟目标值和神经网络,跳过被控对象,直接得到控制器.此外,利用李亚普诺夫理论证明了神经网络的学习速率在一定范围内可以保证控制器的跟踪误差收敛,并且利用虚拟参考反馈整定(VRFT)算法中的滤波器,结合泰勒展开式,进一步验证了闭环控制系统的稳定性.仿真表明,该方法具有计算负担小,采用数据量少,调节参数方便,强跟踪性等优点.  相似文献   

15.
In this paper, we summarize recent progresses made in deep learning based acoustic models and the motivation and insights behind the surveyed techniques. We first discuss models such as recurrent neural networks (RNNs) and convolutional neural networks (CNNs) that can effectively exploit variablelength contextual information, and their various combination with other models. We then describe models that are optimized end-to-end and emphasize on feature representations learned jointly with the rest of the system, the connectionist temporal classification (CTC) criterion, and the attention-based sequenceto-sequence translation model. We further illustrate robustness issues in speech recognition systems, and discuss acoustic model adaptation, speech enhancement and separation, and robust training strategies. We also cover modeling techniques that lead to more efficient decoding and discuss possible future directions in acoustic model research.   相似文献   

16.
17.
Spectrogram representations of acoustic scenes have achieved competitive performance for acoustic scene classification. Yet, the spectrogram alone does not take into account a substantial amount of time-frequency information. In this study, we present an approach for exploring the benefits of deep scalogram representations, extracted in segments from an audio stream. The approach presented firstly transforms the segmented acoustic scenes into bump and morse scalograms, as well as spectrograms; secondly, the spectrograms or scalograms are sent into pre-trained convolutional neural networks; thirdly, the features extracted from a subsequent fully connected layer are fed into (bidirectional) gated recurrent neural networks, which are followed by a single highway layer and a softmax layer; finally, predictions from these three systems are fused by a margin sampling value strategy. We then evaluate the proposed approach using the acoustic scene classification data set of 2017 IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events (DCASE). On the evaluation set, an accuracy of 64.0% from bidirectional gated recurrent neural networks is obtained when fusing the spectrogram and the bump scalogram, which is an improvement on the 61.0% baseline result provided by the DCASE 2017 organisers. This result shows that extracted bump scalograms are capable of improving the classification accuracy, when fusing with a spectrogram-based system.   相似文献   

18.
倪崇嘉  刘文举  徐波 《计算机科学》2011,38(12):242-246
自动韵律间断检测和标注对语音理解和语音合成有十分重要的作用。提出了利用声学、词典和语法相关特征的互补模型方法检测汉语韵律间断。该方法具有下列优点:(1)摒弃了声学相关特征和词典、语法相关特征的独立性假设;(2)互补模型方法不仅在特征层上利用当前音节的上下文信息,而且在模型层次上利用了当前音节的上下文信息。在ASCCD语料库上验证了该方法能够获得90.34%的韵律间断的检测准确率,较基线系统有 6.09%的提高。  相似文献   

19.
赵征鹏  杨鉴 《计算机工程》2005,31(6):148-150
针对云南境内白族、纳西族、傈僳族3个典型的少数民族及汉族普通话语音,采用了高斯混合模型来训练每个民族的口音模型,并用少量的测试语音来获得较为满意的口音分类识别率,目的在于探索降低非母语口音话者语音识别错误率的有效途径.该文通过实验给出,对云南民族口音汉语普通话口音识别,当混合数为16,语音特征采用39维MFCC及其一阶、二阶差分参数时,口音识别正确率可达90.83%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号