共查询到20条相似文献,搜索用时 15 毫秒
1.
基音检测作为语音信号处理的重要手段,被广泛地应用于语音的合成、编码及识别等一系列语音信号处理技术问题。基音检测的准确性对于要求极高的语音识别、合成、分析、压缩编码等等都有重要的意义。该文用自相关函数法、平均幅度差函数法和倒谱法这三种常用的基音检测方法,运用MATLAB编程实现,对语音信号的基音周期轨迹图进行了比较分析,并由此得出和倒谱法进行语音信号基音的检测更为精确。 相似文献
2.
3.
目前语音识别中所用的计算机技术由于依据的理论的局限性,造成识别过程复杂化、使用范围狭窄、难以广泛实用化的困境。本文提出一种新的语音识别理论——状态空间法,以期找到一种解决上述问题的新途径。 相似文献
4.
5.
近年来,随着我国科学技术的不断深入与发展,神经网络逐渐与语音识别技术联系的越来越密切。在传统的语音识别技术中,模板匹配法是其主要的操作方法,而在现代的语音识别技术中,神经网络已成为主要的发展趋势。神经网络技术主要模拟了人类的神经元活动原理,将人类所特有的自主学习、想象能力综合到了语音识别系统中,为语音识别的发展开辟了一条新的途径。本文我们将综合具体事例简要分析深度学习神经网络与语音识别系统的结合。 相似文献
6.
由于工作条件与环境等限制,语音识别在工业生产和日常生活中应用不成熟。基于MFC(microsoft foundation classes)和SI4432无线数据传输终端,完成了电机组语音控制系统设计,该系统由上位机语音识别软件、无线数据传输终端和电机组控制电路组成。针对语音误识和环境嘈杂引起的控制命令错误问题,使用了关键字模糊提取法和无线自组网方式。控制命令从语句中提取,克服了只识别特定命令的缺陷。实践结果表明,该系统的语音识别准确率大于95%,控制命令的提取、传输,以及电机组转速和状态均达到预期效果,具有很好的应用前景。 相似文献
7.
8.
人类的语音情感变化是一个抽象的动态过程,难以使用静态信息对其情感交互进行描述,而人工智能的兴起为语音情感识别的发展带来了新的契机。从语音情感识别的概念和在国内外发展的历史进程入手,分别从5个方面对近些年关于语音情感识别的研究成果进行了归纳总结。介绍了语音情感特征,归纳总结了各种语音特征参数对语音情感识别的意义。分别对语音情感数据库的分类及特点、语音情感识别算法的分类及优缺点、语音情感识别的应用以及语音情感识别现阶段所遇到的挑战进行了详细的阐述。立足于研究现状对语音情感识别的未来研究及其发展进行了展望。 相似文献
9.
主要内容是建立一种基于RBF神经网络的语音识别系统,探讨RBF神经网络在语音识别中的应用.利用有序聚类算法对语音信号进行时间归整,构建一个RBF神经网络,采用自适应的方法确定网络隐节点的个数,用线性最小二乘法确定隐层到输出层的权值,用语音信号的LPCC参数的训练和识别.在Matlab中完成实验,语音信号的识别率达到85%,并且还有很大的提升空间.实验表明RBF神经网络在语音识别中有发展的前景. 相似文献
10.
11.
12.
13.
语音识别技术一直受到各国科学家的广泛关注,如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来.在MATLAB平台上,将语音文件输入,经过时域处理、频域处理、线性预测法提取特征向量,最后进行矢量量化模式匹配.重点是对语音信号进行线性预测分析和矢量量化的模式匹配. 相似文献
14.
本系统是一个在多媒体PC上实现的孤立词识别系统,它提取语音的线性预测系数作为特征参数,并采用Itakura失真测度计算帧间距离,在识别上则使用了动态时轴弯曲(DTW)进行时间匹配,本系统对一般DTW法作了改进,即通过放宽端点限制以更好的语音匹配,克服了一般DTW法要求语音首尾严格对齐而造成的弊病,降低了语音端点检测的精度要求。 相似文献
15.
MATLAB环境下的基于HMM模型的语音识别系统 总被引:5,自引:0,他引:5
在MATLAB环境下利用语音工具箱Voice Box实现基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对20条2~8个字的语音命令进行识别,准确率可达到95%,识别时间1.5~3s,实现了小词汇量连续语音的非特定人的实时识别。 相似文献
16.
提出了一种基于模糊C-means聚类法的矢量量化,并将其用于语音特征的矢量量化。从语音信号中提取12阶MFCC倒谱系数作为待分群样本的矢量数据,有效地降低数据量及计算量,并可以避免杂信的不良影响。且实验得到的码本分布合理,没有空类,表明了该量化方法对语音识别很有效。 相似文献
17.
18.
提出了一种新的连续语音情感识别特征:语音元音段声门激励的时域参数归一化振幅商(the normalized amplitude quotient,NAQ).该方法首先运用迭代自适应逆滤波器(Iterative Adaptive Inverse Filtering,IAIF)估计声门波,然后采用NAQ值来描述声门开启和闭合的特性.采用eNERFACE'05听视觉情感语音数据库中六种不同情感的语音为实验数据,以情感语音元音段的归一化振幅商值为特征,使用直方图和盒形图分析其特征的分布和对情感的区分能力;以情感语句元音段的NAQ值的均值、方差、最大值、最小值作为特征,用高斯混合模型(Gaussian Minute Models,GMM)和k-近邻法进行了语音情感识别实验.结果表明NAQ特征对语音情感具有较强的区别能力. 相似文献
19.
近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型建模技术、解码技术,进行了面向大词汇量的维吾尔语连续语音识别实验。对维吾尔语大词汇量连续语音识别技术进一步发展中存在的问题进行了讨论。 相似文献
20.
语音识别技术的研究与发展 总被引:1,自引:0,他引:1
回顾了语音识别技术的发展历史,描述了语音识别系统的基本原理,介绍了语音识别的几种基本方法,并对语音识别技术面临的问题和发展前景进行了讨论. 相似文献