首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。  相似文献   

2.
针对一些说话人识别方法在应用中要面对海量的集外数据,其很低的错误接受率也会带来大量识别错误的情况,进行了极低错误接受率的说话人识别技术的研究,以求在保证召回率的前提下,将错误接受率降低至约万分之一的水平.研究的重点是对经典的高斯混合模型-通用背景模型(GMM-UBM)方法进行了改进,加入一个确认判决机制来进一步拒绝集外...  相似文献   

3.
计算机集成制造系统的关键在于信息集成,建立CIMS企业全局信息模型是信息集成的基础。本文介绍了“OOCIM--建立CIMS企业全局信息模型的技术”课题及研究背景,论述了CIMS企业全局信息建模的技术,包括信息模型的表达方式及模型组成,全局信息模型的总体结构,建模的过程及其计算机辅助建建模环境等。  相似文献   

4.
关键词确认是语音识别中一个重要的研究方向。对于关键词确认系统来讲,废料模型的结构和类型对整个系统的性能有很大的影响。文中提出了一种基于音节格的废料模型。实验表明,与传统的基于音素类的废料模型相比,关键词确认率有了很大的提高。  相似文献   

5.
关键词确认是语音识别中一个重要的研究方向.对于关键词确认系统来讲,废料模型的结构和类型对整个系统的性能有很大的影响.文中提出了一种基于音节格的废料模型.实验表明,与传统的基于音素类的废料模型相比.关键词确认率有了很大的提高.  相似文献   

6.
分析了基于模型的企业(Model-Based Enterprise,MBE)的背景和定义,研究了MBE的进化和分类,讨论了MBE的关键技术.MBE分为基于通用模型、基于产品和过程集成优化模型、基于知识模型、基于独特知识嵌入模型、基于智慧模型的5种企业类型。研究表明:数字化企业的核心是模型,MBE中的模型本质是知识;基于企业独特知识所建立的模型对于企业核心竞争力具有重要价值;需要采用技术-社会系统的观点、全局的观点、产品生命周期的观点等进行建模优化;MBE的发展趋势是集成化、知识化、智能化、人机一体化、智慧化等.  相似文献   

7.
基于自适应混合高斯模型背景提取的研究   总被引:1,自引:0,他引:1  
运动目标检测的主要方法有相邻帧差法与背景减法,在背景减法中。准确的提取背景是运动目标检测的核心任务之一。背景提取的主要方法有均值法、中值法、Mode算法以及基于单高斯模型与混合高斯模型的背景提取方法,前四种方法的求解过程比较简单,但对于复杂多变的背景,提取的准确性较差.对此本文提出了一种基于自适应混合高斯模型的背景提取的算法,实验结果验证了算法的实用性与有效性。  相似文献   

8.
针对运动目标检测中背景模型的提取和更新,本文首先提出了基于改进K-均值聚类算法的背景提取方法.该方法给出了动态三元组(DTDG)的概念,并且对每个像素用3个动态三元组进行建模,实现了原始背景的提取.其次,提出了一种新颖的自适应背景建模方法.对每个像素维护一个新的动态三元组,根据像素的动态变化信息决定更新策略,实现了背景的自动更新,可以适应光照的突变、缓变和场景本身的变化.实验验证了该方法的有效性.  相似文献   

9.
近年来,嵌入式系统的逐渐完善为网络管理模型的设计提供了一个新的契机。设计一种新的基予嵌入式系统的网络管理模型。该模型以Web浏览器和服务器为框架,通过把Web集成到嵌入式设备中,可以对设备随时随地的进行远程访问及管理。  相似文献   

10.
灰色模型GM(1, 1)优化   总被引:135,自引:2,他引:133  
分析了GM(1, 1)模型产生模拟误差的原因,经大量的数据模拟和GM(1, 1)模型比较,发现背景值的优化使GM(1, 1)模型在短期、中期及长期预测中扩大了适用范围,并且模拟及预测精度显著提高。  相似文献   

11.
罗春梅  张风雷 《声学技术》2021,40(4):503-507
为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法。算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信息,然后采用改进的深度卷积神经网络进一步对准帧间信息,以提高说话人识别特征对背景噪声的适应性。实验结果表明,相比于高斯混合模型-通用背景模型等识别框架及传统MFCC等特征,该算法可取得更高的识别准确率和最小的识别均方误差。  相似文献   

12.
独立分量分析在说话人识别技术中的应用   总被引:2,自引:2,他引:0  
邱作春  曾庆宁 《声学技术》2008,27(6):863-866
独立分量分析方法能够将线性混合信号进行分离,得到统计独立的源信号,能用于提取组合语音的特征基函数。倒谱矢量符合ICA变换的假设条件,用ICA方法对MFCC特征进行转换得到ICA特征基,继而用于说话人识别,建立了一个基于独立分量分析的说话人识别系统。实验结果表明,在噪声环境下此系统具有更高的识别率。  相似文献   

13.
Abstract

This paper presents a method of speaker identification over telephone system based on channel‐effect cancellation. A set of inverse channel spectra is chosen as the basis for generating a channel‐effect‐cancellation filter. The speaker identification scheme is based on vector quantization where the codebooks of each speaker are trained without channel effect. When the speech signal of a speaker goes through the telephone system, a proper channel‐effect‐cancellation filter is generated to minimize the channel effect on the speech signal. The experiments show that the channel effect is mostly contributed by telephone handsets rather than by the transmission lines. By using the proposed method, an identification rate of 93.8% can be achieved for 100 speaker tests.  相似文献   

14.
目的 解决产品开发中用户需求目标不清、产品价值属性模糊等问题。方法 将KANO模型与AHP(Analytic Hierarchy Process,AHP)法融入iNPD(integrated New Product Development)产品开发程序,对智能音箱产品创新设计进行实证研究。首先,通过SET因素分析发现产品机会,引出基础故事情节;其次,基于KANO模型进行智能音箱需求属性划分,以及应用AHP法通过层次模型构建、权重计算等步骤,求解各属性下子需求的重要度;最后,根据用户需求分析,对智能音箱进行构思并提出方案设计。结论 基于KANO模型及AHP法融入iNPD的创新设计方法,实现了智能音箱产品开发中用户全程参与设计与决策,提升了智能音箱创新产品开发的科学性与合理性,增强了设计方案的可行性与有效性,可为同类产品创新设计提供参考路径。  相似文献   

15.
在话者自动辨认系统中,话者数量是决定辨认时间的最主要因素。因而在大数量注册话者的辨认中如何减少辨认所需要的运算时间是一个关键问题。针对这一问题,提出了一种新的基于"码袋"的话者模型设计算法,它通过统计"码袋"中每个码字在话者语音中的概率分布来实现话者模型的设计。实验结果表明该算法在保证较高辨认率的同时,有效地降低了话者自动辨认系统的计算复杂度。  相似文献   

16.
In this paper, the explicit and implicit modelling of the subsegmental excitation information are experimentally compared. For explicit modelling, the static and dynamic values of the standard Liljencrants–Fant (LF) parameters that model the glottal flow derivative (GFD) are used. A simplified approximation method is proposed to compute these LF parameters by locating the glottal closing and opening instants. The proposed approach significantly reduces the computation needed to implement the LF model. For implicit modelling, linear prediction (LP) residual samples considered in blocks of 5 ms with shift of 2.5 ms are used. Different speaker recognition studies are performed using NIST-99 and NIST-03 databases. In case of speaker identification, the implicit modelling provides significantly better performance compared to explicit modelling. Alternatively, the explicit modelling seem to be providing better performance in case of speaker verification. This indicates that explicit modelling seem to have relatively less intra and inter-speaker variability. The implicit modelling on the other hand, has more intra and inter-speaker variability. What is desirable is less intra and more inter-speaker variability. Therefore, for speaker verification task explicit modelling may be used and for speaker identification task implicit modelling may be used. Further, for both speaker identification and verification tasks the explicit modelling provides relatively more complimentary information to the state-of-the-art vocal tract features. The contribution of the explicit features is relatively more robust against noise. We suggest that the explicit approach can be used to model the subsegmental excitation information for speaker recognition.  相似文献   

17.
基于免疫聚类的RBF网络在说话人识别中的应用   总被引:1,自引:1,他引:0  
周燕  胡志峰 《声学技术》2010,29(2):184-187
针对传统的基于RBF(Radial Bais Function)网络的说话人识别系统中聚类中心的数量和位置难以确定的问题,提出了一种基于人工免疫机制的RBF网络作为分类器的说话人识别系统。采用人工免疫机制可根据输入语音数据集合自适应地确定RBF网络隐层中心的数量和初始位置。实际测试表明,该系统具有快速学习网络权重的能力,并且网络的全局寻优能力强,识别率高,是说话人识别的一种有效可行的新方法。  相似文献   

18.
周静雷  景军锋  陈斌 《声学技术》2007,26(4):655-659
提出应用施罗德积分公式定量计算过渡过程时间的方法,从理论上阐明了过渡过程时间和扬声器系统瞬态特性的关系,并将过渡过程时间作为定量描述瞬态特性的参数。进一步分析了低频扬声器单元的过渡过程时间同其低频参数之间的关系。根据上述分析,过渡过程时间短的扬声器系统表现出更好的瞬态特性。这一结论为扬声器系统瞬态特性的研究提供了一个新的思路。  相似文献   

19.
Abstract

To improve performance of a “dual voice coil” (DVC) actuator speaker in an active noise control (ANC) system, a speaker model that includes coupling dynamics and source of noise pressure is first derived to design an adaptive feed‐forward controller based on modified, filtered‐X, recursive‐least‐squares (MFXRLS) algorithm in this investigation. A novel velocity sensor measuring velocity of the speaker face is further developed by use of a frequency‐response method. Two transfer functions required for the velocity sensor are identified in two steps: (i) the adaptive feed‐forward controller is applied to keep speaker face velocity zero to identify the first transfer function; and (ii) the second transfer function is then obtained experimentally using the first transfer function. Performance of the established velocity sensor is similar to that of a Polytec OFV2100 laser velocity transducer. This velocity sensor is then incorporated with the adaptive feed‐forward controller to control the DVC actuator speaker in the ANC system. For a sinusoidal command input of frequency below 390 Hz, the controlled speaker acquires a unit‐gain magnitude and zero phase degree, showing that the controller can effectively reduce effects of the speaker dynamics, including coupling dynamics.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号