共查询到20条相似文献,搜索用时 179 毫秒
1.
QIAN Kai-hua 《数字社区&智能家居》2008,(10)
通过对语音转换的研究,提出了一种把源说话人特征转换为目标说话人特征的方法。语音转换特征参数分为两类:(1)频谱特征参数;(2)基音和声调模式。分别描述信号模型和转换方法。频谱特征用基于音素的2维HMMS建模,F0轨迹用来表示基音和音调。用基音同步叠加法对基音周期﹑声调和语速进行变换。 相似文献
2.
一种基于曲线拟合的二音节汉语声调识别方法 总被引:1,自引:0,他引:1
曹卫华 《计算技术与自动化》1998,17(1):39-42
本文提出了一种利用曲线拟合的方法,对连续二音节汉语语音进行了声调识别,并且加以实现。它采用倒频谱分析技术提取语音的基音周期,并利用倒频谱参数及短时功率进行音节分界。实验证明.基于曲线拟合的汉语声调识别方法,具有算法简单,可适用不同的说话人、高识别正确率等优点,是一种行之有效的方法。 相似文献
3.
4.
基于两级BP模型的普通话声调识别系统 总被引:3,自引:2,他引:1
普通话声调识别参数除常用的基音轮廓外,基音的一阶差分、能量及能量的一阶差分等也具一定的声调特征。实验结果表明:如果将各种参数同时作为一个BP模型的输入参数,声调识别率不但没有提高,反而显著下降,因此,该文提出了将各种参数分别训练一个各自的BP网络,再将这些网络的输出作为另一高层BP网络的输入的普通话声调识别方法。另外,针对上声的特点提出了一种改进的基音平滑算法。这些方法的运用使系统的声调识别率达到90.05%。 相似文献
5.
钱开华 《数字社区&智能家居》2008,(4):132-134
通过对语音转换的研究,提出了一种把源说话人特征转换为目标说话人特征的方法。语音转换特征参数分为两类:(1)频谱特征参数;(2)基音和声调模式。分别描述信号模型和转换方法。频谱特征用基于音素的2维HMMS建模,F0轨迹用来表示基音和音调。用基音同步叠加法对基音厨期、声调和语速进行变换。 相似文献
6.
利用语音信号与噪声信号具有不同相关特性的特点,提出了一种新的加权自相关基频检测算法,该方法可以提高噪声环境下基音检测的准确性。在分类器设计方面,通过引入支持矢量机,进一步提高低信噪比下的汉语声调识别率。实验结果表明,新方法对提高噪声环境下的声调识别效果是十分有效的。 相似文献
7.
利用语音信号与噪声信号具有不同相关特性的特点,提出了一种新的加权自相关基频检测算法,该方法可以提高噪声环境下基音检测的准确性。在分类器设计方面,通过引入支持矢量机,进一步提高低信噪比下的汉语声调识别率。实验结果表明,新方法对提高噪声环境下的声调识别效果是十分有效的。 相似文献
8.
基音检测作为语音信号处理的重要手段,被广泛地应用于语音的合成、编码及识别等一系列语音信号处理技术问题。基音检测的准确性对于要求极高的语音识别、合成、分析、压缩编码等等都有重要的意义。该文用自相关函数法、平均幅度差函数法和倒谱法这三种常用的基音检测方法,运用MATLAB编程实现,对语音信号的基音周期轨迹图进行了比较分析,并由此得出和倒谱法进行语音信号基音的检测更为精确。 相似文献
9.
10.
为了实现甚低码率下的透明语音质量参数语音编码,该文提出了一种新的鲁棒的基音周期估计算法。这种算法采用了改进的自相关函数计算方法,实现了鲁棒的基音周期轨迹跟踪。这种算法不仅能够跟踪快变的基音周期,增强不规则脉冲时基音周期的估计;还能够鲁棒地估计陡变的基音周期。非正式的测试表明这种算法改进了基音周期的估计值,能够极大地降低由于不准确的基音周期估计而引入的听觉失真。 相似文献
11.
针对复杂海洋环境下人工监管船舶行为效率低的问题,提出了一种基于多尺度卷积神经网络的船舶行为识别方法。首先,从船舶自动识别系统(AIS)中获取海量船舶行驶数据,并提取出具有判别力的船舶行为轨迹;然后,根据轨迹数据的特性,利用多尺度卷积设计并实现了针对船舶轨迹数据的行为识别网络,并且使用特征通道加权以及长短时记忆网络(LSTM)来提高算法的准确率。在船舶行为数据集上的实验结果表明,对于指定长度的船舶轨迹,所提识别网络能够达到92.1%的识别准确率,相较于传统的卷积神经网络提高了5.9个百分点,并且在稳定性以及收敛速度上都有明显提升。该方法能够有效地提高船舶行为的识别精度,为海洋监管部门提供高效的技术支持。 相似文献
12.
稠密轨迹的人体行为识别对每一帧全图像密集采样导致特征维数高、计算量大且包含了无关的背景信息。提出基于显著性检测和稠密轨迹的人体行为识别方法。首先对视频帧进行多尺度静态显著性检测获取动作主体位置,并与对视频动态显著性检测的结果线性融合获取主体动作区域,通过仅在主体动作区域内提取稠密轨迹来改进原算法;然后采用Fisher Vector取代词袋模型对特征编码增强特征表达充分性;最后利用支持向量机实现人体行为识别。在KTH数据集和UCF Sports数据集上进行仿真实验,结果表明改进的算法相比于原算法识别准确率有所提升。 相似文献
13.
鉴于无接触体感交互技术在人机交互领域的成功应用,提出了一种基于Kinect深度相机的实时隔空虚拟书写方法。结合颜色和深度数据检测和分割出手掌区域;进一步,通过修改的圆扫描转换算法获得手指的个数,以识别不同的手势指令;根据指尖检测从指尖的运动轨迹分割出独立的字符或汉字运动轨迹,并采用随机森林算法识别该字符或汉字。这种基于深度信息的手势检测和虚拟书写方法可以克服光照和肤色重叠的影响,可靠实时地检测和识别手势和隔空书写的文字,其识别率达到93.25%,识别速度达到25 frame/s。 相似文献
14.
现今智能手机发展迅猛,人们生活质量得到大幅提高。为了更有效地利用智能手机资源,提高用户体验,提出了一种使用超声波的智能手机手势识别系统(AGRS系统)。该系统使用移动设备自带的扬声器发射20 kHz的超声波信号,使用话筒接收反射信号。AGRS系统可通过陀螺仪辅助判断当前手机摆放状态。系统使用虚警率以降低手势误识别率。AGRS利用声波的Doppler效应提取特征值,用FFT算法处理声波信号,最后选择适合的分类器对手势进行识别。实验结果证明AGRS系统手势识别率超过95%。 相似文献
15.
针对现有的手势识别算法识别率低、鲁棒性弱的问题,提出一种基于Kinect骨架信息的交通警察手势识别方法。从Kinect深度图像中预测人体骨架节点的坐标位置,将节点的运动轨迹作为训练和测试的特征,结合距离加权动态时间规整算法和K-最近邻分类器进行识别。实验表明,在参数最优的情况下,该方法对八种交通警察手势的平均识别率达到98.5%,可应用于智能交通等领域。 相似文献
16.
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。 相似文献
17.
在多模态语音情感识别中,现有的研究通过提取大量特征来识别情感,但过多的特征会导致关键特征被淹没在相对不重要特征里,造成关键信息遗漏.为此提出了一种模型融合方法,通过两种注意力机制来寻找可能被遗漏的关键特征.本方法在IEMOCAP数据集上的四类情感识别准确率相比现有文献有明显提升;在注意力机制可视化下,两种注意力机制分别找到了互补且对人类情感识别重要的关键信息,从而证明了所提方法相比传统方法的优越性. 相似文献
18.
在汉语语音识别中应用声调信息的研究 总被引:6,自引:0,他引:6
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。 相似文献
19.
基于模糊混沌神经网络的人脸识别算法 总被引:1,自引:1,他引:0
利用混沌对初值的极端敏感依赖性,可以对仅有微小差别的模式进行识别。提出一种基于模糊混沌神经网络的算法,并应用到人脸识别中。由于引入了混沌噪声,可使网络具有很强的抗干扰能力,能有效避免人脸图像光照、姿态等因素对人脸识别的影响,也避免了复杂的特征提取工作。利用ORL人脸图像数据库进行了仿真实验,结果表明,混沌神经网络算法精度高、迭代步骤少、收敛快,混沌神经网络应用于人脸识别是有效的,能提高识别率。 相似文献
20.
提出了一种高效的基于HSV颜色空间的多目标检测跟踪方法,实现通过摄像机实时检测跟踪多个指尖目标;定义了一套基于指尖运动轨迹的动态手势模型,并提出了动态手势识别方法;对于两点动态手势,通过BP神经网络进行手势学习和手势识别,而对于模拟鼠标手势和四点动态手势,利用指尖之间相互位置关系进行手势识别.测试结果表明,该方法能够快速、准确的跟踪多个运动的指尖目标并进行动态多点手势识别. 相似文献