共查询到19条相似文献,搜索用时 218 毫秒
1.
《计算机应用》2014,(1)
为了更加准确地估计最小音素错误最大后验概率(MPE-MAP)自适应算法中的先验分布中心,使自适应后的声学模型参数更为准确,从而提高系统的识别性能,分别采用最大互信息最大后验概率(MMI-MAP)自适应和基于最大互信息准则与最大似然准则相结合的H-criterion最大后验概率(H-MAP)自适应估计先验分布中心,提出了基于最大互信息最大后验概率先验的最小音素错误最大后验概率(MPE-MMI-MAP)和基于H-criterion最大后验概率先验的最小音素错误最大后验概率(MPE-H-MAP)算法。任务自适应实验结果表明,MPE-MMI-MAP和MPE-H-MAP算法的自适应性能均优于MPE-MAP、MMI-MAP和最大后验概率(MAP)自适应方法,分别比MPE-MAP相对提高3.4%和2.7%。 相似文献
2.
从目标和背景的类间差异性出发,提出了一种基于最大类间交叉熵准则的阈值化分割新算法,算法阈设目标的背景象素的条件分布服从正态分布,利用贝叶期公式估计象素属于目标和背景两类区域的后验概率,再搜索这两为区域后验概率之间的最大交叉熵。比较了新算法一基于最小交叉熵以及基于传统香农熵的阈值化算法的分割性能。 相似文献
3.
探讨了一种基于贝叶斯框架的时空标记场最大后验边缘概率与最大后验概率相结合的运动对象分割算法.通过建立贝叶斯分布模型,求得对象分割标记场的最大后验概率,引入最大后验边缘概率求取最小能量.该算法将时间域分割结果作为初始标记场,空间域的分割结果作为图像的观察场,获取初始运动数目以及相应的运动模型的初始参数,然后通过参数估计,不断更新模型参数,之后通过把每个运动区域和运动模型相关联,来估计运动区域,最终达到分割的目的.实验结果证明,研究的方法对运动目标分割具有较好的分割效果. 相似文献
4.
在基于隐马尔可夫模型的语音合成说话人自适应中,通常的最大似然线性回归(Maximum likelihoad linear regression, MLLR)方法在自适应后的音质和相似度等方面与原始语音仍有一定的差距.为了改善说话人自适应的效果,本文从识别的理论出发,将结构化最大后验概率准则(Structure maximum aposteriori probability, SMAP)应用到语音合成的说话人自适应中,并将MLLR,MAP,SMAP等方法结合使用.通过一系列对参数、数据选取等实验,本文探讨了在语音合成中如何更好地提高说话人自适应后的音质和相似度.实验表明,在结合使用最大后验概率相关准则后,说话人自适应可以取得比MLLR更好的效果. 相似文献
5.
从目标和背景的类间差异性出发,提出了一种基于最大类间交叉熵准则的阈值化分割新算法。该算法假设目标和背景象素的条件分布服从正态分布,利用贝叶斯公式估计象素属于目标和背景两类区域的后验概率,再搜索这两类区域后验概率之间的最大交叉熵。比较了新算法与基于最小交叉熵以及基于传统香农熵的阈值化算法的特点和分割性能。 相似文献
6.
提出了一种基于最大后验概率准则(MAP)-马尔可夫随机场(MRF)的3维超声图像重建算法,在3维重建的过程中可以有效地去除超声图像特有的斑点噪声。首先提出了3维重建的数学模型,它假设所要估计的空间灰度值属于某个函数向量空间,这个向量空间的基函数因支持区域的不同而不同,将Rayle igh分布和G ibbs分布作为先验知识,通过后验概率最大化(MAP)来估计基函数前的系数,在重建算法中,通过将邻点联系强度α设定为随梯度的变化而变化,从而达到了保边界的各向异性滤波特性。采用ICM算法求解这个系数向量。为了提高该算法的效率,又进一步提出了其改进算法,最后的实验结果显示,这种基于MAP-MRF的重建算法可以有效地去除超声图像中的斑点噪声。 相似文献
7.
利用图像小波子带内系数的相关性,提出了一种局部自适应小波去噪方法。首先在贝叶斯最大后验概率准则下推导出基于拉普拉斯先验分布的MAP估计表达式和子带MapShrink阈值。为得到局部自适应的MapShrink阈值和去噪算法,提出将子带内的每个小波系数建模为具有不同边缘标准差的拉普拉斯分布,而边缘标准差又假设为强局部相关的随机变量,可通过邻域局部窗口进行估计。实验结果表明,与经典的子带自适应去噪算法相比较,该方法获得了明显的峰值信噪比增益,主观视觉效果也得到了改善。 相似文献
8.
自适应技术是提高非特定人语音识别系统识别性能的有效手段,其中应用最广泛的两种自适应方法是基于最大后验概率的自适应方法和基于最大似然线性回归的自适应方法,分析了它们各自的特点并将最大后验概率的自适应方法应用到基于隐马尔可夫模型的口令识别系统中,实验结果表明,该方法能够在每个词自适应一次的情况下,使系统的识别率由40%提高到90%以上,并在此基础上实现了一个实用的中等词汇量的口令识别系统。 相似文献
9.
10.
本文主要针对目前turbo码的对数最大后验概率(Log-Map)译码算法和工程中普遍使用的最大值近似最大对数后验概率(Max-Log-Map)译码算法的性能进行了研究和分析,并提出了一种基于泰勒级数近似最大对数后验概率译码算法(Taylor-Log-Map)译码算法。此算法计算简便,易于工程实现,同时具备更加接Log-Map译码的性能。文中在对新算法进行理论推导后,给出了仿真。 相似文献
11.
为了改善发声力度对说话人识别系统性能的影响,在训练语音存在少量耳语、高喊语音数据的前提下,提出了使用最大后验概率(MAP)和约束最大似然线性回归(CMLLR)相结合的方法来更新说话人模型、投影转换说话人特征。其中,MAP自适应方法用于对正常语音训练的说话人模型进行更新,而CMLLR特征空间投影方法则用来投影转换耳语、高喊测试语音的特征,从而改善训练语音与测试语音的失配问题。实验结果显示,采用MAP+CMLLR方法时,说话人识别系统等错误率(EER)明显降低,与基线系统、最大后验概率(MAP)自适应方法、最大似然线性回归(MLLR)模型投影方法和约束最大似然线性回归(CMLLR)特征空间投影方法相比,MAP+CMLLR方法的平均等错率分别降低了75.3%、3.5%、72%和70.9%。实验结果表明,所提出方法削弱了发声力度对说话人区分性的影响,使说话人识别系统对于发声力度变化更加鲁棒。 相似文献
12.
针对传统最大后验(MAP)算法出现阶梯伪影以及不能有效保持重建图像低梯度值处细节信息的问题,提出了一种基于解剖非局部先验的模糊扩散正电子发射计算机断层扫描(PET)重建算法。首先,对中值先验分布的MAP重建进行改进,在每次中值滤波前引入结合模糊函数的各向异性扩散滤波器;然后,采用模糊隶属度函数作为各向异性扩散过程的扩散系数,并结合解剖非局部先验来考虑图像的细节信息。仿真结果表明,与传统算法相比,该算法提高了信噪比(SNR),具有良好的抗噪性;同时视觉效果较好,图像边缘清晰,在抑制噪声和边缘保持方面取得了良好的折中。 相似文献
13.
自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术用在远场噪声混响环境下来分析其在此环境下的识别性能。实验结果表明,仿真条件下,在墙壁反射系数为0.6,各种噪声环境下MAP有最好的自适应性能,在信噪比(Signal-to-Noise Ratio,SNR)分别为5 dB、10 dB、15 dB时,MAP使远场连续语音词错率(Word Error Rate,WER)平均降低了1.51%、12.82%、2.95%。真实条件下,MAP使WER下降幅度最大达到了37.13%。进一步验证了MAP良好的渐进性,且当自适应句数为1 000时,用MAP声学模型自适应方法得到的远场噪声混响连续语音的识别词错率比自适应前平均降低了12.5%。 相似文献
14.
为了解决电话语音说话人确认系统中信道非线性失真导致系统性能下降的问题,提出一种消除信道影响的特征映射方法.采用高斯混合模型建立语音模型,通过最大后验概率自适应某种信道的语音模型,两种模型间相应高斯类的差异描述了该信道对于不同语音的影响.由此得出信道映射规则进行参数补偿,消除训练和测试语音中不匹配的影响.在NIST 1999年和2004年男性说话人的数据库上进行的实验表明,此方法使系统的等错误率分别改善了14.7%和15.18%. 相似文献
15.
16.
针对最大后验(MAP)法对重建图像造成的过度平滑或出现阶梯状边缘伪影等问题,提出了一种基于混合模型的中值先验图像重建算法。首先在中值先验分布的MAP重建的基础上,在每次中值滤波之前引入结合小波收缩和正逆各向异性扩散的滤波器。另外,对于背景区域仍残留有少量噪声的情况下,可以在迭代间的最后,选择加入只针对图像较小梯度阈值区域进行非线性扩散平滑的优良滤波器,从而进一步优化图像。仿真结果表明,该算法在抑制噪声和保持边缘效果方面具有很好的表现,与其他经典传统算法相比,信噪比(SNR)可提高0.9dB~3.8dB。 相似文献
17.
针对现实中训练数据不足的特点,在说话人建模时采用高斯混合模型-通用背景模型(Gaussian Markov Model-Uniform Background Model, GMM-UBM),主要从说话人识别模型的自适应方法和参数估计方法两个方面,研究如何提高说话人识别系统的识别率。在说话人识别模型自适应方面,改进传统的用最大后验概率 MAP (Maximum A Posterior Probability)得到说话人模型的方法,将语音识别中的最大似然线性回归MLLR (Maximum Likelihood Linear Regression)和基于特征音(EigenVoice, EV)的自适应方法,应用到说话人识别模型自适应当中,并将其与MAP方法进行比较。 相似文献
18.
采用模型和得分非监督自适应的说话人识别 总被引:1,自引:0,他引:1
在说话人识别的研究中, 使用以前的测试语句信息对模型参数或者测试得分进行动态更新, 使模型可以更精确地反映测试语句和说话人模型之间的关系, 这种更新策略称为非监督模式, 这方面的研究对实际的说话人识别系统具有非常重要的意义. 本文除了采用非监督的说话人模型自适应更新方法之外, 还提出了非监督的得分域自适应算法: 首先采用双高斯函数对得分建立一个先验的得分模型, 利用最大后验概率准则对得分规整的模型进行调整. 在测试过程中, 采用得分域和模型域的非监督算法可以互相补充, 提高识别率, 在NIST SRE 2006年1训练语段-1测试语段数据库上, 使用模型域和得分域非监督自适应的系统能够取得等错误率4.3%和检测代价函数0.021的结果. 相似文献