期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曹建凯张连海《信号处理》2017,33(5):703-710

提出一种基于层级狄利克雷过程隐马尔科夫模型（HDPHMM）符号化器的无监督语音查询样例检测（QbE-STD）方法。该方法首先应用一个双状态层隐马尔科夫模型,其中顶层状态用于表示所发现的声学单元,底层状态用于建模顶层状态的发射概率,通过对顶层状态假设一个层级狄利克雷过程先验,获得非参贝叶斯模型HDPHMM。使用无标注语音数据对该模型进行训练,然后对测试语音和查询样例输出后验概率特征矢量,使用非负矩阵分解算法对后验概率进行优化得到新的特征,然后在此基础上,应用修正分段动态时间规整算法进行检索,构成QbE-STD系统。实验结果表明,相比于基于高斯混合模型符号化器的基线系统,本文所提出的方法性能更优,检索精度得到显著提升。相似文献

2.

基于音素后验概率和层次凝聚聚类算法的音素边界检测

下载免费PDF全文

冯志远张连海《太赫兹科学与电子信息学报》2014,12(2):260-265

提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。相似文献

3.

基于计算机系统平台上的动态时间规整算法在基因比对中的应用

孙弢《无线互联科技》2014,(10):169-169

信息技术在各个领域的广泛应用也促使生物科学技术的变革,利用计算机系统平台解决基因表达数据时间序列的相似查询有多种方法,本文介绍了一个最常用的算法——在动态时间规整算法基础上进行优化的多分段动态时间规整算法,本文主要研究使用多分段的动态时间规整算法对酵母的基因表达数据进行序列比对,主要从计算速度,时间复杂度,比对精度等方面进行了实验分析。相似文献

4.

一种鲁棒性音素分段算法

马建芬李鸿燕张雪英王华奎《电声技术》2006,(6):44-45,48

基于小波变换的鲁棒性因素分段算法的基本思想是在运用传统的参数滤波方法进行音素分段之前首先将语音信号在小波域中进行滤波,提出对听觉感知有效的语音分量,然后用传统的参数滤波方法进行分段。参数滤波是以一个变化的参数对信号进行滤波,得到信号在不同频带中的分量,可以证明,若滤波参数以一定的规律变化,则这些滤波分量的一阶自相关表示了信号的相关结构。利用新方法进行分段并测试其鲁棒性,实验证明新方法分段效果好且鲁棒性强,是一种有效的音素分段算法。相似文献

5.

改进的LVQ网络与DTW相结合的语音识别方法

吴金南宫宁生《微电子学与计算机》2009,26(5)

提出一种基于动态时间规整(DTW)和改进的学习矢量量化(LoPLVQ)的神经网络的语音识别方法.该方法用动态时间规整算法先对语音信号进行时间规整,然后通过改进的学习矢量量化神经网络进行语音的分类识别.实验表明,新系统在大规模语音识别方面不仅能缩短训练时间,而且具有较高的识别率. 相似文献

6.

改进的高效动态时间规整算法语音识别系统

王新胜巩捷甫喻明艳《太赫兹科学与电子信息学报》2015,13(6):942-946

动态时间规整算法是结合了动态时间规整(DTW)技术和距离测度计算技术的一种非线性规整算法,在语音识别模板匹配中有重要的应用。为此提出一种改进的高效动态时间规整算法,其能有效加快搜索路径的寻找。基于Matlab实现了隐马尔科夫算法、高效动态时间规整算法和改进的高效动态时间规整算法的语音识别系统,同时进行了算法的仿真实验。实验结果表明,基于改进高效动态时间规整算法的训练速度远大于基于隐马尔可夫算法和高效动态时间规整算法的训练速度,而识别率下降很小,对于小词汇量非连续语音识别中高效动态时间规整算法的识别率为97.56%,隐马尔可夫算法的识别率为97.14%,改进高效动态时间规整算法的识别率为96.43%。相似文献

7.

基于小波变换的音素分段算法

黄蓉汤一彬孙大飞吴镇扬《太赫兹科学与电子信息学报》2009,7(1):44-47

在语音信号处理中,作为预处理前端的语音分段技术对于语音增强、编码和识别都有极其重要的作用。本文分析比较了几种传统的语音分段算法的性能,重点研究基于小波变换的语音音素分段算法,针对平滑渐变的低频能量不能对音素进行有效分割的缺点,提出了基于小波变换累积能量包络的语音分段算法。但由于小波的敏感性,会出现一定数目的伪点,本文提出2种去除伪点的方法,从而提高了音素分段的精确度。相似文献

8.

基于点过程模型连续语音关键词检测

下载免费PDF全文

王勇张连海《太赫兹科学与电子信息学报》2013,11(6):958-963

提出了基于点过程模型（PPM）的连续语音关键词检测方法。该方法首先利用时态模式（TRAP）特征和多层感知器（MLP）计算每个音素的帧级后验概率,在此基础上,将语音可看作多个相互独立的事件（音素）,利用泊松过程对事件建立点过程模型,最后通过计算似然比达到关键词检测目的。实验结果表明,对8kHz采样语音,关键词平均召回率和准确率分别可达69．5％和82％以上。相似文献

9.

基于概率神经网络的数字音识别

单伟《无线互联科技》2012,(11):20-23,25

本文主要利用概率神经网络和动态时间规整技术来实现数字音的识别研究。结论是在利用概率神经网络进行语音识别时可以达到比较高的识别率,此外动态时间规整函数的加入,解决了神经网络的模板规整问题。作为语音识别技术的基础,其中包含了小波的基础理论,语音的预处理,DTW技术,端点检测等基础技术。对于神经网络的加入,更加有利于深入了解神经网络这一新兴技术。相似文献

10.

基于加权有限状态机的动态匹配词图生成算法

郭宇弘黎塔肖业鸣潘接林颜永红《电子与信息学报》2014,36(1):140-146

由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。相似文献

11.

Turbo-MIMO系统中一种基于部分后验概率的软检测算法

尤明厚陶小峰崔琪楣张平《电子与信息学报》2010,32(7):1531-1537

迭代树搜索(ITS)是一种有效的基于M-算法的软MIMO检测方案。然而ITS会遇到某些比特的对数似然比(LLR)无法确定的情况,虽可采用赋常数值方法(称为clipping)解决,但这会影响系统性能。为此,该文提出一种新的基于M-算法的软检测方案。该方案在树的每一级递推计算部分符号序列的后验概率,并基于此近似计算从第1级到该级的所有比特LLR,再采用M-算法保留部分符号序列延伸至下一级。该算法可确保每比特都可计算LLR,且能得到可靠性高的LLR值。考虑到某些比特LLR会多次计算,文中给出了算法的低复杂度实现。另外,该文还给出了一种计算符号序列后验概率的简单方法。最后,仿真结果表明所提算法相比ITS具有更好的性能,并使性能与复杂度达到较好的折中。相似文献

12.

基于变化检测和改进的GVF snake模型的运动目标轮廓提取

祝世平高洁《光电子．激光》2013,(9):1803-1810

为了解决当前目标跟踪中目标轮廓提取不精确的问题,在对传统GVF (gradient vector flow)snake活动轮廓模型改进的基础上,提出一种基于变化检测和改进的GVF snake活动轮廓模型的视频目标轮廓提取算法。首先,通过基于t显著性检验的变化检测方法消除背景边界的影响,并获取初始运动变化区域的临界四边形作为GVF snake的初始轮廓。然后,对初始轮廓应用改进的GVF snake模型以获得精确的轮廓边界。改进模型采用4方向各项异性扩散,并采用下降速度较快的保真项系数以增强 GVF snake进入凹陷的能力,且保持对弱边界的收敛。本文方法克服了手动绘制初始轮廓的缺点,对传统GVF snake方法进行了改进,且空间准确度(SA)有很大提高。实验表明 ,本文方法成功分割出目标凹陷部分并对弱边界有较好的收敛效果,提高了轮廓提取的精确度。相似文献

13.

Multiresolution segmentation of respiratory electromyographicsignals

Haan-Go Choi Principe J.C. Hutchison A.A. Wozniak J.A. 《IEEE transactions on bio-medical engineering》1994,41(3):257-266

Analysis of respiratory electromyographic (EMG) signals in the study of respiratory control requires the detection of burst activity from background (signal segmentation), and focuses upon the determination of onset and cessation points of the burst activity (boundary estimation). The authors describe a new automated multiresolution technique for signal segmentation and boundary estimation. During signal segmentation, a new transitional segment is defined which contains the boundary between background a burst activity. Boundary estimation is then performed within this transitional segment. Boundary candidates are selected and a probability is attributed to each candidate, using an artificial neural network. The final boundary for a given transitional segment is the boundary estimate with the maximum a posteriori probability. This new method has proved accurate when compared to boundaries chosen by two investigators 相似文献

14.

基于隐马尔可夫模型的用户行为异常检测新方法 总被引：2，自引：0，他引：2

邬书跃田新广《通信学报》2007,28(4):38-43

提出一种基于隐马尔可夫模型的用户行为异常检测方法,主要用于以shell命令为审计数据的主机型入侵检测系统。与Lane T提出的检测方法相比,所提出的方法改进了对用户行为模式和行为轮廓的表示方式,在HMM的训练中采用了运算量较小的序列匹配方法,并基于状态序列出现概率对被监测用户的行为进行判决。实验表明,此方法具有很高的检测准确度和较强的可操作性。相似文献

15.

基于shell命令和Markov链模型的用户行为异常检测

田新广孙春来段洣毅《电子与信息学报》2007,29(11):2580-2584

异常检测是目前入侵检测系统(IDS)研究的主要方向。该文提出一种基于shell命令和Markov链模型的用户行为异常检测方法,该方法利用一阶齐次Markov链对网络系统中合法用户的正常行为进行建模,将Markov链的状态与用户执行的shell命令联系在一起,并引入一个附加状态;Markov链参数的计算中采用了运算量较小的命令匹配方法;在检测阶段,基于状态序列的出现概率对被监测用户当前行为的异常程度进行分析,并提供了两种可选的判决方案。文中提出的方法已在实际入侵检测系统中得到应用,并表现出良好的检测性能。相似文献

16.

DTW Based Classification of Diverse Pre-Processed Time Series Obtained from Handwritten PIN Words and Signatures

Muzaffar Bashir Jürgen Kempf 《Journal of Signal Processing Systems》2011,64(3):401-411

Personal identity verification by means of signature handwriting dynamics is a widely researched aspect of behavioral biometrics. The Dynamic Time Warping (DTW) technique has been successfully used for accessing the similarity of time series of handwritten objects by minimizing non-linear time distortions. Generally, in DTW based classifiers, the sequences are normalized in time and amplitude domains. In the paper, different length and amplitude normalization techniques are applied on signatures and handwritten PIN word sequences and their influence on accuracy of recognition are examined. A special approach to amplitude normalization based on reference level assigned Dynamic Time Warping (DTW) technique is presented. The standard deviation values calculated from the time series are used as so called bio-reference levels to improve the performance of classification. For this, they are added to the time series of query and sample datasets prior to DTW matching. The acquisition of online data is carried out by a digital pen equipped with pressure and inclination sensors. The time series obtained from the pen during handwriting provide valuable insight into the unique characteristics of the writers. Experimental results show that with the help of proposed length and amplitude normalizations of sequences including the bio-reference levels, the computational time is reduced and false acceptance rates are decreased. 相似文献

17.

基于语速调整和音位属性后验概率的音素识别

许友亮张连海张文林李永彬《信号处理》2012,28(2):295-300

基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响;另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担。本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3%。相似文献

18.

一种基于改进DTW算法的动态手势识别方法

何超胡章芳王艳《数字通信》2013,(3):21-25

结合Kinect传感器提出了一种基于改进的DTW算法的动态手势识别方法。首先,通过SDK对Kinect传感器获得的深度信息进行分析,获得人体骨骼点3D位置,选取其中4个点作为手部运动特征;然后,用加权距离和全局路径限制的方法对传统的DTW算法进行改进;最后,用改进的DTW算法进行模板训练和实现动态手势的识别。实验表明：该方法能很好地实现动态手势的识别,实时性好,在背景干扰和光照方面有较强的鲁棒性,较传统的DTW算法在识别速度和识别正确率方面有所提高。相似文献

19.

An ultra-fast user-steered image segmentation paradigm: live wire on the fly 总被引：2，自引：0，他引：2

Falcão AX Udupa JK Miyazawa FK 《IEEE transactions on medical imaging》2000,19(1):55-62

We have been developing general user steered image segmentation strategies for routine use in applications involving a large number of data sets. In the past, we have presented three segmentation paradigms: live wire, live lane, and a three-dimensional (3-D) extension of the live-wire method. In this paper, we introduce an ultra-fast live-wire method, referred to as live wire on the fly, for further reducing user's time compared to the basic live-wire method. In live wire, 3-D/four-dimensional (4-D) object boundaries are segmented in a slice-by-slice fashion. To segment a two-dimensional (2-D) boundary, the user initially picks a point on the boundary and all possible minimum-cost paths from this point to all other points in the image are computed via Dijkstra's algorithm. Subsequently, a live wire is displayed in real time from the initial point to any subsequent position taken by the cursor. If the cursor is close to the desired boundary, the live wire snaps on to the boundary. The cursor is then deposited and a new live-wire segment is found next. The entire 2-D boundary is specified via a set of live-wire segments in this fashion. A drawback of this method is that the speed of optimal path computation depends on image size. On modestly powered computers, for images of even modest size, some sluggishness appears in user interaction, which reduces the overall segmentation efficiency. In this work, we solve this problem by exploiting some known properties of graphs to avoid unnecessary minimum-cost path computation during segmentation. In live wire on the fly, when the user selects a point on the boundary the live-wire segment is computed and displayed in real time from the selected point to any subsequent position of the cursor in the image, even for large images and even on low-powered computers. Based on 492 tracing experiments from an actual medical application, we demonstrate that live wire on the fly is 1.3-31 times faster than live wire for actual segmentation for varying image sizes, although the pure computational part alone is found to be about 120 times faster. 相似文献