期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

马勇鲍长春《信号处理》2013,29(9):1190-1199

说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望。相似文献

2.

基于说话人聚类和高斯混合模型的语言辨识研究

屈丹侯风雷王炳锡吴保民《信号处理》2004,20(3):285-289

本文给出了一种语言辨识的新方法。通常来讲,语言辨识系统是说话人无关的,但说话人的个体特征对语言辨识系统有很大的影响,文本采用了一种粗分类精识别的思想,利用说话人聚类技术有效解决了粗分类的问题,对每类相近说话人集合建立模型,然后进行识别。实验表明,该方法对于说话人无关的语言辨识问题是有效的。相似文献

3.

基于聚类统计与文本无关的说话人识别研究 总被引：4，自引：2，他引：4

邓浩江王守觉邢藏菊李倩《电路与系统学报》2001,6(3):77-80

从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种裂合并的聚类算法,并用于与本文无关的说话人识别研究,初步建立了基于聚类统计的开放系统,该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行了模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实践研究中,研究了特征矢量的加权,语音段的时长以及a因子的选择对系统性能的影响。相似文献

4.

一种改进的模糊C-均值聚类算法在说话人识别中的应用 总被引：3，自引：0，他引：3

杨彦赵力《电声技术》2006,(1):40-43

提出了一种将改进的FCM聚类算法与矢量量化相结合的说话人识别的方法。先从语音信号中提取待识别的特征矢量集,再利用矢量量化来设计码本,最后用改进的算法对待识别语音进行辩识。该算法解决了FCM算法对初始值敏感、易陷入局部最优的问题。所使用的特征参数较少,计算比较简单,但识别率较高,且具有较好的鲁棒性。相似文献

5.

语音分段在基于GMM-SVM说话人确认中的应用

饶为王典洪麦文伟《电子技术》2010,47(3):18-19

在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问题,提出了基于时间间隔对语音数据进行分段的方法,来增多正样本点数,得到更好的分类超平面。美国国家标准与技术研究所(NIST)2002年说话人识别数据库上的实验证明,语音分段的方法能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。相似文献

6.

应用说话人聚类技术改善语言辨识系统识别率

张强屈丹侯风雷王炳锡《电声技术》2007,31(3):44-48

说话人差异是影响语言辨识系统性能的一个重要方面.采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚类后的语言辨识系统.高斯混合模型、高斯混合模型-全局背景模型和遍历隐马尔可夫模型3种语言模型的实验证明,这种方法是有效的,它普遍地减小了说话人差异对语言辨识的影响,提高了语言辨识率. 相似文献

7.

基于特征均值距离的短语音段说话人聚类算法

下载免费PDF全文

李艳雄吴永贺前华《电子与信息学报》2012,34(6):1404-1407

该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度;然后,迭代合并特征均值距离最小的两个类,直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试,结果表明：与基于AHC+BIC的算法相比,F度量值平均提高了5%,运算速度约为以前算法的4.68倍。相似文献

8.

跨域注意力特征融合的说话人确认方法

杨震王天朗郭海燕王婷婷《通信学报》2023,44(8):89-98

针对目前说话人确认系统中前端特征的语音信号样点间结构信息缺失问题,提出了跨域注意力特征融合的说话人确认方法。首先,提出了一种基于图信号处理的图频域特征提取方法来有效利用语音信号的结构信息,将语音信号帧的每个样点作为图节点,构建语音图信号,通过图傅里叶变换以及滤波器组提取图频域特征。其次,提出了一种由残差模块与挤压-激励模块构成的注意力特征融合网络,对传统时频域特征与图频域特征进行跨域融合,来提升说话人确认系统的性能。最后,在Vox Celeb、SITW和CN-Celeb数据集上进行实验。实验结果表明,所提方法在等错误率以及最小检测代价函数的评价指标上,优于基线模型ECAPA-TDNN。相似文献

9.

基于多聚类结果融合的轨迹聚类方法

李静张磊韩陈寿《微电子学与计算机》2011,28(8):63-66

针对轨迹聚类结果的不可靠性,提出一种基于多聚类结果融合的轨迹聚类方法MRMTC.对于多聚类器产生的多个聚类代表轨迹,提出了轨迹合并算法,实现了多个聚类代表轨迹的合并.代表轨迹合并算法以平均扫描线距离函数作为共识函数,通过共识函数对代表轨迹间的相似度进行比较,最后合并相似的代表轨迹.实验表明基于融合的轨迹聚类方法,可以获... 相似文献

10.

基于说话人特有特征集的GMM和i-矢量方法的说话人识别

沈思秋吕勇杨芸齐彦云《电子设计工程》2014,(23):184-188

在说话人识别中,当存在两个或多个发声类似的说话人时,会导致错误识别。为了提高在这种情况下的识别准确率,在音素层次上找出说话人特有的特征,将这些特征的子集构成一个该说话人特有的特征集,然后在这些特征集的基础上用GMM和i-矢量的方法对说话人进行识别。在实验室环境下收集了50个说话人的声音,分别在不同信噪比的环境下进行测试。实验结果表明提出的方法能够提高当存在发声类似的说话人时的识别准确率。相似文献

11.

广播音频目标语音检测技术研究

吕兰兰《数字技术与应用》2009,(11):125-126

针对广播电视新闻节目中的音频信息的特点,利用说话人检测技术,提出了目标语音的检测和定位算法,可以快速挖掘和定位特定发言人或主持人的相关信息,效果良好。相似文献

12.

基于MVQM的说话人识别的研究

谢建平成新民赵力《电声技术》2006,(2):41-43

提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。相似文献

13.

一种GMM对数似然得分变换方法

冷自强王金明《电子质量》2009,(1):8-9

基于高斯混合模型（GMM）的说话人识别方法通常采用对数似然得分作为测试时判定目标说话人的依据。文章在分析对数似然得分特点的基础上,提出了一种改进方法,提高了测试语音帧对于目标模型和非目标模型得分的相对差值。基于TIMIT数据库的实验证明了采用变换后似然得分的说话人识别系统比采用对数似然得分的系统具有更好的识别性能和抗噪声性能。相似文献

14.

基于少量训练样本的说话人识别研究

王巍王成友唐朝京《电声技术》2000,(11):3-6

在ＨＭＭ的基础上,针对少量的训练样本情况,提供了一种新的训练算法—ＭＣＥ（ＭｉｎｉｍｕｍＣｌａｓｓｉｆｉｃａｔｉｏｎＥｒｒｏｒ）算法,并利用该算法建立了一个局部范围内不依赖于文本的说话人辨认系统,当每个说话人的样本训练量为１０时,系统识别的正确率达到了９７．１４％。相似文献

15.

多样本状态加权合成的CGHMM训练算法

陆汝华李盛欣《太赫兹科学与电子信息学报》2012,10(5):574-578

为解决隐马尔可夫模型(HMM)中参数很多,实际当中难以提供足够多训练数据的问题,根据观察值序列的状态分布情况,描述了一种基于状态加权合成的连续高斯混合密度隐马尔可夫模型(CGHMM)训练算法,对多个CGHMM模型进行加权合成,并将此方法应用于轴承故障诊断进行仿真实验。实验结果表明,平均训练时间为12.86 s,诊断时间为0.189 s,诊断准确度为96%。可见,多样本状态加权合成的CGHMM轴承故障诊断方法确实有效可行,具有良好的应用前景。相似文献

16.

结合高斯回归模型和隐马尔可夫随机场的模糊聚类图像分割 总被引：2，自引：0，他引：2

下载免费PDF全文

赵雪梅李玉赵泉华《电子与信息学报》2014,36(11):2730-2736

为了克服经典模糊聚类图像分割算法对图像噪声的敏感性,该文提出结合高斯回归模型(GRM)和隐马尔科夫随机场(HMRF)的模糊聚类图像分割算法。该算法用信息熵正则化模糊C均值(FCM)的目标函数,再用KL(Kullback-Leibler)信息加以改进,并将HMRF和GRM模型应用到该目标函数中,其中HMRF模型通过先验概率建立标号场邻域关系,而GRM模型则在中心像素标号与其邻域像素标号一致的基础上建立特征场邻域关系。利用提出的算法和其它经典算法分别对模拟图像、真实SAR图像以及纹理图像进行了分割实验,并对分割结果进行精度评价。实验结果表明,该文提出的算法具有更高的分割精度。相似文献

17.

基于嵌入式系统的语音口令识别系统的实现

王大巍《电子技术》2010,47(7):21-22

语音口令识别是语音信息处理的一个重要研究方向,本文给出一种基于嵌入式系统的语音口令识别系统的设计方案,硬件系统的核心芯片是嵌入式微处理器,语音口令识别算法采用连续隐马尔克夫模型。实验结果表明,将语音识别系统与嵌入式系统相结合,可以使语音口令识别系统广泛应用于便携式设备中。相似文献

18.

基于隐式马尔科夫参数模型的图像消噪研究

下载免费PDF全文

李宏升徐洪章《激光与红外》2013,43(10):1184-1187

针对隐式马尔科夫模型在图像消噪中的不足,采用参数求解方法.首先对参数模型三元组确定其限制条件,通过递归计算状态概率,通过最大似然估计来使期望最大化,期望最大化过程包括期望过程和最大化过程;在图像消噪中提取观察信号过程利用Kullback-Leibler距离设置其阈值,最终给出了参数解.实验仿真表明本文算法能够保持图像有用信息,执行速度快. 相似文献

19.

复杂背景中维-汉混排字符串的分割技术研究

阿不都萨拉木·达吾提 ;杨燚 ;艾斯卡尔·艾木都拉《激光杂志》2014,(7):5-10

提出了一种基于混合高斯模型拟合选取阈值和区域生长的图像分割方法:首先利用笔画方向算子对文字笔画进行抽样,再利用混合高斯模型拟合其灰度直方图,确定样本的最佳分割阈值,最后利用样本的标准差作为生长规则的判断依据分割文字。该算法计算量小,实时性和分割精度均有一定优势,在提取目标的同时,残留背景像素极少,使下一步的目标识别更为简单。相似文献

20.

基于kinect的家居安全防护系统

孟欢《电子测试》2016,(21):25-27

为了更好的保障家庭生活的安全,本文提出了一种基于Kinect的家居安全防护系统.该系统利用Kinect传感器的人体行为识别、深度数据探测的功能完成入侵检测,并整合报警系统,形成了一整套的家居安全防护.此外,该系统可靠、有效,且操作简单,较传统的安全防护系统更加精准化、智能化. 相似文献