首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
黄双  李婧  王洪莹  杨军  张波 《计算机应用》2006,26(Z2):287-289
提出了一种新的评价英语发音质量的算法.该算法采用基于隐马尔科夫模型(HMM)的语音识别技术,引入各音素对应的发音易混淆模型(Pronunciation Confusion Model),定义段时长归一化的相似度比例对数为各音素的发音质量分数,并综合得到整句发音的评分结果.该算法降低了不同发音人对评分准确性的影响,提高了系统的稳健性.实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,明显优于其他评分算法.  相似文献   

2.
基于语言学知识的发音质量评价算法改进   总被引:1,自引:1,他引:0  
随着普通话推广工作的深入,采用计算机进行普通话的辅助测试和学习的需求日益迫切。本文针对普通话发音特点,提出了一种改进的基于音素的自动发音质量评价算法。新算法在隐马尔科夫模型的对数后验概率算法基础上,引入普通话发音的语言学知识。与改进前相比,新算法不仅降低了运算量,而且在普通话水平测试的 303 人现场录音库上,使得机器打分与国家级评测员打分之间的相关度从0. 704 提升到0. 795 。  相似文献   

3.
高斯混合模型(GMM)是进行说话人无关的语言辨识的一种有效方法,高斯混合二元模型(GMBM)是GMM模型的二元时序扩展,该文在GMBM和GMM-UBM模型的基础上提出了一种基于GMBM-UBBM模型的语言辨识系统,并利用OGI-TS电话语音库对算法的性能进行了测试,然后给出了实验结果。实验结果表明,该算法也是进行语言辨识的一种有效方法,与传统的GMM-UBM算法相比,该算法最多可以获得4.378%的相对改善率。  相似文献   

4.
基于HMM的普通话单字发音准确度评价方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
在大量语音分析实验的基础上,提出了一种普通话单字发音准确度计算辅助评价方法。细化声韵母,对反映普通话发音准确度的声韵过渡段建立连续高斯混合密度HMM的普通话发音标准度评价系统。在语音特征上采取了符合人耳听觉特征的Mel倒谱。最后结合基音特征,完成客观特征到主观评价的映射。实验证明,该方法取得了较好的效果。  相似文献   

5.
从当前普通话测试的现状与需求出发,对基于ARM-Linux的语音评价系统进行了深入研究,提出了基于嵌入式技术的普通话发音质量评价方案。其中,系统硬件以S3C2410X处理器和UDA134TS为主要部分,软件则主要研究基于语音特征比较的普通话评价方法。本设计方案能有效实现普通话测试系统从PC平台到嵌入式平台的移植。  相似文献   

6.
基于背景模型的运动车辆检测算法研究   总被引:4,自引:1,他引:3  
本文给出一种改进的背景初始化和更新算法,动态调整参数学习率,缩短了建立背景模型的时间,提高了背景模型适应环境变化的能力。采用Otsu阈值化方法自动选取全局阈值,完成二值化处理。结合形态学方法,去除噪音点的影响。实验表明,本文的方法能更快、更准确地检测出运动车辆区域。  相似文献   

7.
为提高英语发音机器质量评估综合性能,以S3C2440A芯片为主控芯片,UDA1341Ts为编码解码器搭建系统硬件,通过采用多层小波特征尺度变换提取英语发音机器语音信号特征,并利用支持向量机(SVM)对语音信号特征进行分类评价,设计了一种基于数据挖掘的英语发音机器自动评估系统。测试结果表明,所设计的自动评估系统可从语调、语速、音准、节奏、情感5个方面,对英语发音机器进行自动综合评估,相较于基于大数据分析的评价系统和多源反馈评价系统,具有更高的精确一致率、相邻一致率以及皮尔逊相关系数值,且误判率更低,在10%范围内,具有一定的有效性和优越性。  相似文献   

8.
随着经济建设的快速发展,城市交通问题成为了人们亟待解决的问题。在智能交通系统领域中,背景提取和背景更新成为近年来计算机视觉领域的研究热点[1]。提出了一种应用于智能视频监控中的背景更新方法。在视频图像中,通过利用高斯混合模型获取背景图像,通过分块背景更新的方式提高背景更新的速度。  相似文献   

9.
提出一种使用韵律模型的方法来改进计算机辅助语言学习中的发音质量评价性能.该方法在原有的单音子和三音子模型的基础上,添加了韵律因素.一方面,这使得对影响发音质量最大的元音音素的描述更为细致;另一方面,包含韵律模型的方法从一定程度上解决了使用母语训练库和非母语测试库之间的模型不匹配问题,为语言学习机在母语和非母语之间的交叉应用提供了可能.同时,这种改进的方法还为计算机辅助语言学习系统中的错误检测和反馈提供了很好的参考,更进一步增加了发音质量评价模块在整个学习机系统中的指导作用.试验中,使用WSJ(母语库)作为训练库,ESC(非母语库)作为测试库,基于带韵律的Mono-Phone模型得到的匹配分数,段长分数,感知分数融合结果与主观评价之间的最终相关性为0 839,比原有基本英语音素的方法的融合结果提高了0 08(0 753).  相似文献   

10.
实现了一种基于虚拟检测线的道路车流量检测算法.利用高斯混合背景模型进行背景建模,检测出包含运动目标的图像块,系统根据超过检测线的连通区域图像面积占整个连通区域面积的比值来判断是否有车辆经过,进而实现车流量统计.  相似文献   

11.
余巍  李辉 《计算机工程》2011,37(23):162-164
基于高斯混合模型(GMM)-通用背景模型(UBM)结构的说话人确认系统不能完全表现说话人的个性特征信息。为此,将聚类方法和排序高斯混合模型相结合,对每个高斯分量按照对应排序值顺序排列,并对UBM进行训练。基于NIST 06 8side-1side数据库的实验结果表明,该方法能在基本保持系统识别性能的前提下,降低UBM的训练运算量。  相似文献   

12.
基于音素评分模型的发音标准度评测研究   总被引:1,自引:1,他引:0  
在计算机辅助语言学习系统中,后验概率是普通话水平测试(PSC)电子化系统衡量考生发音标准程度的重要指标,但后验概率与人工的主观评分存在着显著差别。该文提出了“音素评分模型”的思想,对后验概率进行变换。该文研究了线性和非线性的sigmoid音素评分模型,并发现线性音素评分模型有闭式全局最优解,非线性音素评分模型可用梯度下降法求解。在全国采集的498人的普通话考试现场数据集上的实验表明该策略能使系统评分性能有明显的提升 当后验概率在全音素概率空间中计算时,可使系统性能提升约42%;当后验概率在优化的概率空间中计算时,能使系统性能提升约23%~27%。  相似文献   

13.
14.
声纹识别中,提出基于隐马尔可夫-通用背景模型的识别算法。针对声纹密码中每个人的注册语音数据量很少的问题,提出使用大量其他人数据先建立话者无关的声韵母隐马尔可夫模型作为通用背景模型,再根据最大后验概率准则,以通用背景模型为基础使用训练语音自适应获得说话人模型。该方法解决在声纹密码识别中训练数据不足的问题。在讯飞桌面数据库Ⅱ上,采用该算法的系统的等错误率为6。8%。  相似文献   

15.
针对运动检测算法中目标空洞和环境噪声难以消除等问题,提出一种背景建模算法。将待处理图像通过三层高斯模糊滤镜,分层抽取图像信息,通过分层建立分裂高斯混合模型,进行建模并计算运动区域。将上层提取的低频信息以及建模后提取的粗块化运动目标,加入到下层的背景判定计算流程中,根据综合判定结果纠正下层错误的模型参数。在公共数据库中的实验结果表明,该算法在高效地去除了环境噪声的情况下,可保证所提取运动目标的准确性,并且对光照突变不敏感,有较好的检测率和较低的误检率。  相似文献   

16.
针对经典混合高斯模型无法识别静态目标的问题,提出一种改进算法。通过加入了参数还原算法,并引入一个反馈调节环节,可以避免静态前景被学习进入背景。当目标停留超过预定帧数时,目标所覆盖的每个像素点的K个高斯函数进行参数还原,避免了目标被更新为背景的一部分。实验结果表明,提出的改进模型,不仅能检测长时间静止目标,而且能识别多模态背景。  相似文献   

17.
基于混合高斯模型的目标差分自适应背景模型   总被引:2,自引:0,他引:2  
提出一种自适应背景更新率的方法。在混合高斯背景模型基础上。通过混合高斯匹配将前后两帧分割出的运动目标作差分。差分后再次采用混合高斯匹配分辨出过去目标区和当前目标区。在背景更新的过程中,加大过去目标区的更新率,让运动目标在出现停滞状态时给背景模型带来的干扰区域得到快速恢复。试验结果表明,该方法有效地提高背景模型的鲁棒性。  相似文献   

18.
提出一种基于混合高斯模型(GMM)与码本算法的前景目标检测方法。利用GMM进行背景图像建模并初步提取前景对象,对背景图像进行码本学习,将码本建模得到的前景对象与GMM得到的前景对象相融合,根据前后2次帧间差分得到前景对象的比例关系,自适应地更新高斯参数和扩展码字,得到前景对象目标。实验结果表明,该方法实时性好,可消除视频序列中的阴影和鬼影,提取完整的前景对象。  相似文献   

19.
孙毅刚  李鸿  张红颖 《计算机工程》2012,38(18):166-170
在运动目标停滞的情况下,传统的混合高斯模型会将运动目标误判为背景,导致目标漏检。为此,提出一种基于改进混合高斯模型的目标检测算法。引入背景学习参数,结合前一帧的检测结果自适应地更新背景,从而提取完整的运动目标。利用像素的八连通区域信息抑制噪声,提高算法在复杂环境中的稳定性。实验结果表明,与传统检测方法相比,该算法能够在复杂环境中准确地检测出短暂停滞的运动目标。  相似文献   

20.
针对业余歌手模仿专业歌手唱歌过程中音色不变的问题,提出一种基于高斯混合模型(GMM)的中文歌曲Morphing算法,采用GMM对语音频谱建模,并通过混合业余歌手和专业歌手的语音频谱,实现歌曲的音色转换。结果显示,混合比例因子k=0或1时,ABX测试正确率均为100%,0相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号