首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
马勇  鲍长春 《信号处理》2013,29(9):1190-1199
说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望。   相似文献   

2.
本文给出了一种语言辨识的新方法。通常来讲,语言辨识系统是说话人无关的,但说话人的个体特征对语言辨识系统有很大的影响,文本采用了一种粗分类精识别的思想,利用说话人聚类技术有效解决了粗分类的问题,对每类相近说话人集合建立模型,然后进行识别。实验表明,该方法对于说话人无关的语言辨识问题是有效的。  相似文献   

3.
基于聚类统计与文本无关的说话人识别研究   总被引:4,自引:2,他引:4  
从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种裂合并的聚类算法,并用于与本文无关的说话人识别研究,初步建立了基于聚类统计的开放系统,该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行了模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实践研究中,研究了特征矢量的加权,语音段的时长以及a因子的选择对系统性能的影响。  相似文献   

4.
一种改进的模糊C-均值聚类算法在说话人识别中的应用   总被引:3,自引:0,他引:3  
杨彦  赵力 《电声技术》2006,(1):40-43
提出了一种将改进的FCM聚类算法与矢量量化相结合的说话人识别的方法。先从语音信号中提取待识别的特征矢量集,再利用矢量量化来设计码本,最后用改进的算法对待识别语音进行辩识。该算法解决了FCM算法对初始值敏感、易陷入局部最优的问题。所使用的特征参数较少,计算比较简单,但识别率较高,且具有较好的鲁棒性。  相似文献   

5.
在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问题,提出了基于时间间隔对语音数据进行分段的方法,来增多正样本点数,得到更好的分类超平面。美国国家标准与技术研究所(NIST)2002年说话人识别数据库上的实验证明,语音分段的方法能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。  相似文献   

6.
说话人差异是影响语言辨识系统性能的一个重要方面.采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚类后的语言辨识系统.高斯混合模型、高斯混合模型-全局背景模型和遍历隐马尔可夫模型3种语言模型的实验证明,这种方法是有效的,它普遍地减小了说话人差异对语言辨识的影响,提高了语言辨识率.  相似文献   

7.
该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度;然后,迭代合并特征均值距离最小的两个类,直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试,结果表明:与基于AHC+BIC的算法相比,F度量值平均提高了5%,运算速度约为以前算法的4.68倍。  相似文献   

8.
针对目前说话人确认系统中前端特征的语音信号样点间结构信息缺失问题,提出了跨域注意力特征融合的说话人确认方法。首先,提出了一种基于图信号处理的图频域特征提取方法来有效利用语音信号的结构信息,将语音信号帧的每个样点作为图节点,构建语音图信号,通过图傅里叶变换以及滤波器组提取图频域特征。其次,提出了一种由残差模块与挤压-激励模块构成的注意力特征融合网络,对传统时频域特征与图频域特征进行跨域融合,来提升说话人确认系统的性能。最后,在Vox Celeb、SITW和CN-Celeb数据集上进行实验。实验结果表明,所提方法在等错误率以及最小检测代价函数的评价指标上,优于基线模型ECAPA-TDNN。  相似文献   

9.
针对轨迹聚类结果的不可靠性,提出一种基于多聚类结果融合的轨迹聚类方法MRMTC.对于多聚类器产生的多个聚类代表轨迹,提出了轨迹合并算法,实现了多个聚类代表轨迹的合并.代表轨迹合并算法以平均扫描线距离函数作为共识函数,通过共识函数对代表轨迹间的相似度进行比较,最后合并相似的代表轨迹.实验表明基于融合的轨迹聚类方法,可以获...  相似文献   

10.
在说话人识别中,当存在两个或多个发声类似的说话人时,会导致错误识别。为了提高在这种情况下的识别准确率,在音素层次上找出说话人特有的特征,将这些特征的子集构成一个该说话人特有的特征集,然后在这些特征集的基础上用GMM和i-矢量的方法对说话人进行识别。在实验室环境下收集了50个说话人的声音,分别在不同信噪比的环境下进行测试。实验结果表明提出的方法能够提高当存在发声类似的说话人时的识别准确率。  相似文献   

11.
针对广播电视新闻节目中的音频信息的特点,利用说话人检测技术,提出了目标语音的检测和定位算法,可以快速挖掘和定位特定发言人或主持人的相关信息,效果良好。  相似文献   

12.
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。  相似文献   

13.
基于高斯混合模型(GMM)的说话人识别方法通常采用对数似然得分作为测试时判定目标说话人的依据。文章在分析对数似然得分特点的基础上,提出了一种改进方法,提高了测试语音帧对于目标模型和非目标模型得分的相对差值。基于TIMIT数据库的实验证明了采用变换后似然得分的说话人识别系统比采用对数似然得分的系统具有更好的识别性能和抗噪声性能。  相似文献   

14.
在HMM的基础上,针对少量的训练样本情况,提供了一种新的训练算法—MCE(Minimum Classification Error)算法,并利用该算法建立了一个局部范围内不依赖于文本的说话人辨认系统,当每个说话人的样本训练量为10时,系统识别的正确率达到了97.14%。  相似文献   

15.
为解决隐马尔可夫模型(HMM)中参数很多,实际当中难以提供足够多训练数据的问题,根据观察值序列的状态分布情况,描述了一种基于状态加权合成的连续高斯混合密度隐马尔可夫模型(CGHMM)训练算法,对多个CGHMM模型进行加权合成,并将此方法应用于轴承故障诊断进行仿真实验。实验结果表明,平均训练时间为12.86 s,诊断时间为0.189 s,诊断准确度为96%。可见,多样本状态加权合成的CGHMM轴承故障诊断方法确实有效可行,具有良好的应用前景。  相似文献   

16.
为了克服经典模糊聚类图像分割算法对图像噪声的敏感性,该文提出结合高斯回归模型(GRM)和隐马尔科夫随机场(HMRF)的模糊聚类图像分割算法。该算法用信息熵正则化模糊C均值(FCM)的目标函数,再用KL(Kullback-Leibler)信息加以改进,并将HMRF和GRM模型应用到该目标函数中,其中HMRF模型通过先验概率建立标号场邻域关系,而GRM模型则在中心像素标号与其邻域像素标号一致的基础上建立特征场邻域关系。利用提出的算法和其它经典算法分别对模拟图像、真实SAR图像以及纹理图像进行了分割实验,并对分割结果进行精度评价。实验结果表明,该文提出的算法具有更高的分割精度。  相似文献   

17.
王大巍 《电子技术》2010,47(7):21-22
语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。  相似文献   

18.
李宏升  徐洪章 《激光与红外》2013,43(10):1184-1187
针对隐式马尔科夫模型在图像消噪中的不足,采用参数求解方法.首先对参数模型三元组确定其限制条件,通过递归计算状态概率,通过最大似然估计来使期望最大化,期望最大化过程包括期望过程和最大化过程;在图像消噪中提取观察信号过程利用Kullback-Leibler距离设置其阈值,最终给出了参数解.实验仿真表明本文算法能够保持图像有用信息,执行速度快.  相似文献   

19.
提出了一种基于混合高斯模型拟合选取阈值和区域生长的图像分割方法:首先利用笔画方向算子对文字笔画进行抽样,再利用混合高斯模型拟合其灰度直方图,确定样本的最佳分割阈值,最后利用样本的标准差作为生长规则的判断依据分割文字。该算法计算量小,实时性和分割精度均有一定优势,在提取目标的同时,残留背景像素极少,使下一步的目标识别更为简单。  相似文献   

20.
孟欢 《电子测试》2016,(21):25-27
为了更好的保障家庭生活的安全,本文提出了一种基于Kinect的家居安全防护系统.该系统利用Kinect传感器的人体行为识别、深度数据探测的功能完成入侵检测,并整合报警系统,形成了一整套的家居安全防护.此外,该系统可靠、有效,且操作简单,较传统的安全防护系统更加精准化、智能化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号