首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
针对作者已经提出的双因子高斯过程隐变量模型(Two-factor Gaussian process latent variable model,TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model,HMM)对语音动态特征进行建模,并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡.  相似文献   

2.
基于HMM模型的语音单元边界的自动切分   总被引:1,自引:0,他引:1  
基于隐尔马可夫模型(HMM)的强制对齐方法被用于文语转换系统(TTS)语音单元边界切分.为提高切分准确性,本文对HMM模型的特征选择,模型参数和模型聚类进行优化.实验表明:12维静态Mel频率倒谱系数(MFCC)是最优的语音特征;HMM模型中的状态模型采用单高斯;对于特定说话人的HMM模型,使用分类与衰退树(CART)聚类生成的绑定状态模型个数在3 000左右最优.在英文语音库中音素边界切分的实验中,切分准确率从模型优化前的77.3%提高到85.4%.  相似文献   

3.
对电子音乐进行合理且有效的分类,可以使用户能快速搜索到喜爱的音乐,也使音乐推荐系统能进行更加精准的推荐。为了提高音乐分类的准确性,论文提出了基于CGABC-SVM的多特征融合音乐分类方法。在特征提取方面,针对单一音频特征表达不完整的问题,提取基音频率、共振峰、梅尔频率倒谱系数和相对谱-感知线性预测4种音频特征,组成多特征融合矩阵。在分类器选择方面,针对支持向量机(SVM)参数难以选取的问题,论文使用交叉全局人工蜂群算法(CGABC)来优化SVM的参数,构建CGABC-SVM音乐分类模型。实验结果表明,论文音乐分类方法可以有效地区分各种音乐信号,音乐分类的准确性显著好于对比音乐分类方法。  相似文献   

4.
为了提升深度卷积神经网络对音乐频谱流派特征的提取效果,提出一种基于频谱空间域特征注意的音乐流派分类算法模型DCNN-SSA。DCNN-SSA模型通过对不同音乐梅尔谱图的流派特征在空间域上进行有效标注,并且改变网络结构,从而在提升特征提取效果的同时确保模型的有效性,进而提升音乐流派分类的准确率。首先,将原始音频信号进行梅尔滤波,以模拟人耳的滤波操作对音乐的音强及节奏变化进行有效过滤,所生成的梅尔谱图进行切割后输入网络;然后,通过深化网络层数、改变卷积结构及增加空间注意力机制对模型在流派特征提取上进行增强;最后,通过在数据集上进行多批次的训练与验证来有效提取并学习音乐流派特征,从而得到可以对音乐流派进行有效分类的模型。在GTZAN数据集上的实验结果表明,基于空间注意的音乐流派分类算法与其他深度学习模型相比,在音乐流派分类准确率和模型收敛效果上有所提高,准确率提升了5.36个百分点~10.44个百分点。  相似文献   

5.
人体行为识别对于个人辅助机器人和智能家居等一些智能应用,是非常必要的功能,本文运用SVM&HMM混合分类模型进行日常生活环境的人体行为识别。首先,使用微软的Kinect(一种RGBD感应器)作为输入感应器,提取融合特征集,包括运动特征、身体结构特征、极坐标特征。其次,提出SVM&HMM模型, SVM&HMM二级模型发挥了SVM和HMM各自的优点,既结合了SVM适于反映样本间差异性特点,又发挥了HMM适合处理连续行为的特点。该二级模型克服了单一SVM模型、传统HMM模型和在人体复杂和相似行为建模过程中精度、鲁棒性和计算效率上的不足。通过大量实验,结果表明SVM&HMM二级模型对室内日常行为的识别具有较高的识别率,且具有较好的区分性和鲁棒性。  相似文献   

6.
基于循环神经网络的语音识别模型   总被引:5,自引:1,他引:4  
朱小燕  王昱  徐伟 《计算机学报》2001,24(2):213-218
近年来基于隐马尔可夫模型(HMM)的语音识别技术得到了很大发展。然而HMM模型有着一定的局限性,如何克服HMM的一阶假设和独立性假设带来的问题一直是研究讨论的热点,在语音识别中引入神经网络的方法是克服HMM局限性的一条途径。该文将循环神经网络应用于汉语语音识别,修改了原网络模型并提出了相应的训练方法,实验结果表明该模型具有良好的连续信号处理性能,与传统的HMM模型效果相当,新的训练策略能够在提高训练速度的同时,使得模型分类性能有明显提高。  相似文献   

7.
一种新的隐马尔可夫模型及其在手绘图形识别中的应用   总被引:2,自引:0,他引:2  
提出了一种新的隐马尔可夫模型——自适应隐马尔可夫模型(AHMM).与传统的开环HMM相区别,AHMM是一种用于识别的带反馈机制的闭环HMM.AHMM采用带有压缩率调整因子的特征压缩算法,首先对待识别的特征序列进行较高压缩率的压缩,然后将压缩得到的特征序列送入HMM识别器进行识别.根据对识别效果满意度的判决,确定是否需要调整压缩率因子以获得较长的特征序列,并重新送入HMM识别器进行识别.将该文提出的AHMM用于联机手绘图形的识别,实验表明,AHMM方法与传统的HMM方法相比,识别率和识别速度均有显著提高.  相似文献   

8.
针对隐马尔科夫模型(HMM)在跨站脚本检测中对初始先验假设估计不准确和以极大似然准则规定的HMM参数分类能力差的缺陷,提出了一种基于MLP-HMM的跨站脚本检测模型。首先,使用自然语言处理(NLP)方法解决数据高维复杂性问题。然后,通过多层感知机(MLP)神经网络学习对整个模型进行权值微调得到初始观察矩阵。最后,将该观察矩阵代入HMM中,增强HMM参数构建能力和分类能力。结果表明,结合MLP的HMM相比于原始HMM以及传统算法在跨站脚本检测上检测率有显著提高,并缩短了检测时间。  相似文献   

9.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

10.
针对模拟电路在故障预测与健康管理(PHM)系统中早期故障识别率不高的问题,提出了一种基于隐马尔科夫模型(HMM)和支持向量机(SVM)相结合的模拟电路故障诊断方法,利用HMM对动态连续信号的较强识别能力和SVM良好的模式分类能力解决模拟电路早期故障诊断问题。采用主成分分析(PCA)和K-means聚类算法对故障数据进行数据降维和特征提取,建立HMM与 SVM相结合的诊断模型进行故障诊断。仿真实验表明,HMM-SVM能很好地识别模拟电路早期故障,并对模拟电路中元件小范围参数变化的状态识别,相较单一HMM模型具有更高的准确率。  相似文献   

11.
一种新型的两级指纹分类方法   总被引:2,自引:0,他引:2  
提出了一种利用隐马尔可夫模型(HMM)和支持向量机(SVM)的两级指纹分类新方法. 该方法采用指纹编码(FingerCode)作为指纹的特征表述,在对分类器进行训练之后,首先用5个 伪二维HMM对待分类指纹进行类别初选,确定最可能的两种指纹分类结果,再用相应的SVM 分类器做最终判决.最后使用NIST-4数据库中的2000幅指纹和CQU-VERIDICOM数据库的 1000幅指纹对该方法进行了实验,其分类的准确性为91%,连续性为93.7%,这证明了该方法的 有效性.  相似文献   

12.
In this paper, a new appearance-based 3D object classification method is proposed based on the Hidden Markov Model (HMM) approach. Hidden Markov Models are a widely used methodology for sequential data modelling, of growing importance in the last years. In the proposed approach, each view is subdivided in regular, partially overlapped sub-images, and wavelet coefficients are computed for each window. These coefficients are then arranged in a sequential fashion to compose a sequence vector, which is used to train a HMM, paying particular attention to the model selection issue and to the training procedure initialization. A thorough experimental evaluation on a standard database has shown promising results, also in presence of image distortions and occlusions, the latter representing one of the most severe problems of the recognition methods. This analysis suggests that the proposed approach represents an interesting alternative to classic appearance-based methods to 3D object classification.  相似文献   

13.
针对传统隐马尔可夫模型(HMM)在识别对象时没有有效利用所识别对象的结构信息,提出了一种基于原图像分块的HMM。这种模型利用原图像的各个分块作为状态,因此具有相应的拓扑结构,可以为所识别对象的结构信息建模。为了增强模型的描述能力与精确性,采用二阶HMM,引入了终止状态,将其应用在手写数字识别中。考虑到手写数字的结构特点与模型的拓扑结构,提出了一种提取手写数字笔画特征的方法,即根据叉点提取各个笔段的特征向量。对MNIST字库进行测试,平均识别率为95.7%。  相似文献   

14.
隐马尔可夫模型是对DNA序列建模的一种简单且有效的模型, 实际应用中通常采用一阶隐马尔可夫模型. 然而, 由于其一阶无后效性的特点, 一阶隐马尔科夫模型无法表示非相邻碱基间的依赖关系, 从而导致序列中一些有用统计特征的丢失. 本文在分析DNA序列特有的生物学构造的基础上, 提出一种用于DNA序列分类的二阶隐马尔可夫模型, 该模型继承了一阶隐马尔可夫模型的优点, 充分表达了蕴涵在DNA序列中的生物学统计特征, 使得新模型具有明确的生物学意义. 基于新模型, 提出一种DNA序列的贝叶斯分类新方法, 并在实际DNA序列上进行了实验验证. 实验结果表明, 由于二阶隐马尔可夫模型充分反映了DNA序列碱基间的结构信息, 新方法有效地提高了序列的分类精度.  相似文献   

15.
探讨了利用Gabor小波和隐马尔可夫模型(HMM)进行人脸识别的方法,首先对人脸图像进行多分辨率的Gabor小波变换;然后在图像上放置一组网格结点,每个结点用该结点处的多尺度Gabor幅度特征描述,采用独立元分析法对每个结点进行去相关和降维;最后形成特征结,把每个特征结作为观测向量,对隐马尔可夫模型进行训练,并将优化的模型参数用于人脸识别,ORL人脸库的实验结果表明,该方法识别率高,工程上易于应用。  相似文献   

16.
原媛  卓东风 《微机发展》2014,(1):184-187,191
剩余寿命预测是作出正确的状态维修决策的基础和前提,是设备退化状态识别的重要内容。隐马尔可夫模型(HMM)是一种具有较强模式分类能力的统计分析算法,但是它不能直接用于剩余寿命的预测,而且考虑到隐马尔可夫模型的局限性和剩余寿命预测模型的可解释性,应用隐半马尔可夫模型(HSMM)进行建模和预测。针对HSMM的训练算法极易陷人局部极值点的问题,提出了基于改进微粒群优化算法(MPSO)进行修正。实验结果证明了该方法在设备剩余寿命预测研究上的有效性和可行性。  相似文献   

17.
A new hidden Markov model (HMM) based feature generation scheme is proposed for face recognition (FR) in this paper. In this scheme, HMM method is used to model classes of face images. A set of Fisher scores is calculated through partial derivative analysis of the parameters estimated in each HMM. These Fisher scores are further combined with some traditional features such as log-likelihood and appearance based features to form feature vectors that exploit the strengths of both local and holistic features of human face. Linear discriminant analysis (LDA) is then applied to analyze these feature vectors for FR. Performance improvements are observed over stand-alone HMM method and Fisher face method which uses appearance based feature vectors. A further study reveals that, by reducing the number of models involved in the training and testing stages of LDA, the proposed feature generation scheme can maintain very high discriminative power at much lower computational complexity comparing to the traditional HMM based FR system. Experimental results on a public available face database are provided to demonstrate the viability of this scheme.  相似文献   

18.
HMM模型具有良好的适应性,可以自动学习,对预测随机时序数据性能良好。场景是足球视频的基本特征,场景的转换体现了足球视频的摄制、编辑模式,表现了足球视频的语义。提出了一种基于场景分析和HMM的视频语义分析框架,用于识别足球视频中的一些语义事件。为了克服以往基于主颜色和其他底层特征的视频场景分析中存在的较大误差,又提出基于视觉注意模型对足球视频中的场景进行分析。实验结果表明,基于场景分析和HMM的事件识别方法对足球视频中的任意球事件有良好的识别效果  相似文献   

19.
View-invariant human action recognition is a challenging research topic in computer vision. Hidden Markov Models(HMM) and their extensions have been widely used for view-invariant action recognition. However those methods are usually according to a large parameter space, requiring amounts of training data and with low classification accuracies for real application. A novel graphical structure based on HMM with multi-view transition is proposed to model the human action with viewpoint changing. The model consists of multiple sub action models, which correspond to the traditional HMM utilized to model the human action in a particular rotation viewpoint space. In the training process, the novel model can be built by connecting the sub action models between adjacent viewpoint spaces. In the recognition process, action with unknown viewpoint is recognized by using improved forward algorithm. The proposed model can not only simplify the model training process by decomposing the parameter space into multiple sub-spaces, but also improve the performance the algorithm by constraining the possible viewpoint changing. Experiment results on IXMAS dataset demonstrated that the proposed model obtains better performance than other recent view-invariant action recognition method.  相似文献   

20.
This paper presents an improved method based on single trial EEG data for the online classification of motor imagery tasks for brain-computer interface (BCI) applications. The ultimate goal of this research is the development of a novel classification method that can be used to control an interactive robot agent platform via a BCI system. The proposed classification process is an adaptive learning method based on an optimization process of the hidden Markov model (HMM), which is, in turn, based on meta-heuristic algorithms. We utilize an optimized strategy for the HMM in the training phase of time-series EEG data during motor imagery-related mental tasks. However, this process raises important issues of model interpretation and complexity control. With these issues in mind, we explore the possibility of using a harmony search algorithm that is flexible and thus allows the elimination of tedious parameter assignment efforts to optimize the HMM parameter configuration. In this paper, we illustrate a sequential data analysis simulation, and we evaluate the optimized HMM. The performance results of the proposed BCI experiment show that the optimized HMM classifier is more capable of classifying EEG datasets than ordinary HMM during motor imagery tasks.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号