首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 90 毫秒
1.
马勇  鲍长春 《信号处理》2013,29(9):1190-1199
说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望。   相似文献   

2.
本文给出了一种语言辨识的新方法。通常来讲,语言辨识系统是说话人无关的,但说话人的个体特征对语言辨识系统有很大的影响,文本采用了一种粗分类精识别的思想,利用说话人聚类技术有效解决了粗分类的问题,对每类相近说话人集合建立模型,然后进行识别。实验表明,该方法对于说话人无关的语言辨识问题是有效的。  相似文献   

3.
基于聚类统计与文本无关的说话人识别研究   总被引:4,自引:2,他引:4  
从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种裂合并的聚类算法,并用于与本文无关的说话人识别研究,初步建立了基于聚类统计的开放系统,该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行了模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实践研究中,研究了特征矢量的加权,语音段的时长以及a因子的选择对系统性能的影响。  相似文献   

4.
一种改进的模糊C-均值聚类算法在说话人识别中的应用   总被引:3,自引:0,他引:3  
杨彦  赵力 《电声技术》2006,(1):40-43
提出了一种将改进的FCM聚类算法与矢量量化相结合的说话人识别的方法。先从语音信号中提取待识别的特征矢量集,再利用矢量量化来设计码本,最后用改进的算法对待识别语音进行辩识。该算法解决了FCM算法对初始值敏感、易陷入局部最优的问题。所使用的特征参数较少,计算比较简单,但识别率较高,且具有较好的鲁棒性。  相似文献   

5.
在说话人确认系统的实际应用中,让用户提供大量的训练语音是不现实的,所以在GMM-SVM系统中,正样本点数通常只有一个,而负样本点数远远多于正样本点数,造成SVM分类超平面严重偏向负样本,这种情况对于支持向量机的性能影响很大。针对此问题,提出了基于时间间隔对语音数据进行分段的方法,来增多正样本点数,得到更好的分类超平面。美国国家标准与技术研究所(NIST)2002年说话人识别数据库上的实验证明,语音分段的方法能在一定程度上提升整个说话者确认系统的识别精度和鲁棒性。  相似文献   

6.
说话人差异是影响语言辨识系统性能的一个重要方面.采用说话人聚类技术对训练数据进行了预分类,以此为基础训练各种语言模型,得到聚类后的语言辨识系统.高斯混合模型、高斯混合模型-全局背景模型和遍历隐马尔可夫模型3种语言模型的实验证明,这种方法是有效的,它普遍地减小了说话人差异对语言辨识的影响,提高了语言辨识率.  相似文献   

7.
该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度;然后,迭代合并特征均值距离最小的两个类,直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试,结果表明:与基于AHC+BIC的算法相比,F度量值平均提高了5%,运算速度约为以前算法的4.68倍。  相似文献   

8.
针对目前说话人确认系统中前端特征的语音信号样点间结构信息缺失问题,提出了跨域注意力特征融合的说话人确认方法。首先,提出了一种基于图信号处理的图频域特征提取方法来有效利用语音信号的结构信息,将语音信号帧的每个样点作为图节点,构建语音图信号,通过图傅里叶变换以及滤波器组提取图频域特征。其次,提出了一种由残差模块与挤压-激励模块构成的注意力特征融合网络,对传统时频域特征与图频域特征进行跨域融合,来提升说话人确认系统的性能。最后,在Vox Celeb、SITW和CN-Celeb数据集上进行实验。实验结果表明,所提方法在等错误率以及最小检测代价函数的评价指标上,优于基线模型ECAPA-TDNN。  相似文献   

9.
针对轨迹聚类结果的不可靠性,提出一种基于多聚类结果融合的轨迹聚类方法MRMTC.对于多聚类器产生的多个聚类代表轨迹,提出了轨迹合并算法,实现了多个聚类代表轨迹的合并.代表轨迹合并算法以平均扫描线距离函数作为共识函数,通过共识函数对代表轨迹间的相似度进行比较,最后合并相似的代表轨迹.实验表明基于融合的轨迹聚类方法,可以获...  相似文献   

10.
在说话人识别中,当存在两个或多个发声类似的说话人时,会导致错误识别。为了提高在这种情况下的识别准确率,在音素层次上找出说话人特有的特征,将这些特征的子集构成一个该说话人特有的特征集,然后在这些特征集的基础上用GMM和i-矢量的方法对说话人进行识别。在实验室环境下收集了50个说话人的声音,分别在不同信噪比的环境下进行测试。实验结果表明提出的方法能够提高当存在发声类似的说话人时的识别准确率。  相似文献   

11.
多阈值图像分割中经常出现所选阈值数量不能事先确定的情况。为解决这一问题,提出一种基于聚类技术的多阈值图像分割方法,通过Mean Shift技术找出模式中心,通过迭代选择确定相邻模式中心的不同阈值,最后用多阈值完成对图像的分割。仿真实验结果表明,这一方法可有效应用于图像分割,并取得较好的效果。  相似文献   

12.
宋长新 《激光与红外》2012,42(11):1306-1310
聚类作为一种重要的图像分割方法得到了大量研究,提出了一种新的结合稀疏编码的红外图像聚类分割算法,扩展了传统的基于K-means聚类的图像分割方法。结合稀疏编码的聚类算法能有效融合图像的局部信息,而且易于利用像素之间的内在相关性,但是对于分割会出现过分割和像素难以归类的问题。为此,在字典的学习过程中,将原子的聚类算法引入其中,有助于缩减字典中原子所属类别的数目防止出现过分割;同时将稀疏编码系数同原子对聚类中心的隶属程度相结合来判断像素所属的类别。这种处理方式能更好地实现利用像素的内在相关性进行聚类分割,并在其中自然引入了局部空间信息,达到更好分离目标区域和背景区域的目的。实验结果表明,结合稀疏编码的K-means聚类分割算法能更好的实现复杂背景下红外图像重要区域的准确分割提取。  相似文献   

13.
基于分水岭变换和蚁群聚类的图像分割   总被引:1,自引:0,他引:1  
针对传统分水岭分割算法对噪声敏感和易于产生过分割问题,提出一种新的基于分水岭和蚁群智能聚类的图像分割方法(CWAC,Combining watersheds and ant colony clustering).CWAC方法首先用分水岭变换对图像做初分割,然后用蚁群方法在区域之间进行聚类合并,获得最终的分割结果.CWAC不但成功地解决了分水岭存在的过分割问题,还大大提高了蚁群聚类算法的搜索效率;本文利用分水岭变换后的灰度信息和空间信息,定义了一种新的引导函数,可更准确有效引导蚁群聚类.实验结果表明CWAC可以快速准确地分割出目标,是一种有效的图像分割方法.  相似文献   

14.
一种定位人脸部特征的光学聚类方法   总被引:1,自引:1,他引:1  
人脸识别技术需要对脸部特征进行定位,从而有助于确保图像一致和建立人脸模型.提出了一种新的脸部特征定位方法,通过Gabor滤波器处理得到人脸图像的强度响应,其中,脸部特征表现为强响应,而其他部分表现为弱响应,如面颊和额头.通过保留强响应以及过滤弱响应,可以获得属于脸部特征的所有像素点.采用了聚类算法--k均值算法将不同的像素点分配到不同的簇里面,每一个簇都代表一个脸部特征.通过在ORL人脸数据库上的测试表明:此方法能精确、快速地定位诸如眼睛、鼻子、嘴等脸部特征.此外,此方法能够在有浓密胡须的对象上成功定位脸部特征,表现出较高的鲁棒性.  相似文献   

15.
谭永前  曾凡菊 《光电子.激光》2021,32(10):1065-1073
针对传统SLIC(simple linear iterative clustering)超像素分割算法没有综合考虑图像的纹理信息特征,导致对边缘信息较强和纹理复杂的图像进行超像素分割时,出现边缘检测不灵敏,分割效果不理想的问题.提出了把原图像先经过噪声抑制提取出纹理特征分量,构建以颜色特性、纹理特征和空间位置特征相融合...  相似文献   

16.
谱聚类是在给定数据集上用基于图论的方法进行分类,并已广泛地应用于SAR图像分割.自调整谱聚类(self-tuning spectral clustering,简称STSC)方法是一种可以自动确定尺度因子和分类数的方法.本文给出了一种改进的STSC方法,使用熵函数作为自动求分类数的代价函数,使得分类数的计算更加准确和有效,提高了方法的分类精度.实验表明,改进的STSC方法对自然图像、SAR图像的分割精度高于原STSC方法.  相似文献   

17.
李健勇  徐连宇 《电讯技术》2013,53(2):172-176
复杂环境下的多目标视频跟踪是计算机视觉领域的一个难点,有效处理目标间遮挡是解决多目标跟踪问题的关键。提出了一种融合遮挡分割的多目标跟踪算法,计算每个目标的光流速度概率直方图,反映其运动统计信息;综合使用外观、运动、颜色信息构造新的像素距离表达,借助分阶段分类思想及K均值聚类技术进行遮挡分割,得到准确的运动前景像素;在粒子滤波器跟踪框架下,使用概率外观模型进行多目标跟踪,更好地处理动态遮挡问题。实验表明,所提算法解决了复杂环境下的多目标跟踪问题。  相似文献   

18.
卷积神经网络在高级计算机视觉任务中展现出强 大的特征学习能力,已经在图像语义 分割任务 中取得了显著的效果。然而,如何有效地利用多尺度的特征信息一直是个难点。本文提出一 种有效 融合多尺度特征的图像语义分割方法。该方法包含4个基础模块,分别为特征融合模块(feature fusion module,FFM)、空 间信息 模块(spatial information module,SIM)、全局池化模块(global pooling module,GPM)和边界细化模块(boundary refinement module,BRM)。FFM采用了注意力机制和残差结构,以提高 融合多 尺度特征的效率,SIM由卷积和平均池化组成,为模型提供额外的空间细节信息以 辅助定 位对象的边缘信息,GPM提取图像的全局信息,能够显著提高模型的性能,BRM以残差结构为核心,对特征图进行边界细化。本文在全卷积神经网络中添加4个基础模块, 从而有 效地利用多尺度的特征信息。在PASCAL VOC 2012数据集上的实验结 果表明该方法相比全卷积神 经网络的平均交并比提高了8.7%,在同一框架下与其他方法的对比结 果也验证了其性能的有效性。  相似文献   

19.
孙劲光  陈倩 《光电子.激光》2022,(11):1215-1224
针对脑肿瘤图像分割中网络模型信息损耗、上下文信息联系不足及网络泛化能力较差导致分割精度较低的问题,提出了一种新型的脑肿瘤图像分割方法,该方法是通过深度门控卷积模块(depth gate convolution,DGC)和特征增强模块(feature enhancement module,FEM)组成的多层级连接(multi-level connection,MC)脑肿瘤分割模型。采用深度卷积模块降低特征信息在逐层传递的信息损耗;使用控制门单元(control gate unit,CGU)实现各个尺度的特征图的MC,其中组合池化来减少下采样过程中的信息丢失;通过FEM增强分割区域的特征权重。实验结果表明,预测分割脑肿瘤的整体肿瘤区(whole tumor,WT)、核心肿瘤区(tumor core,TC)和增强肿瘤区(enhancement tumor,ET)的Dice系数分别达到了0.92、0.84和0.83,Hausdorff距离达到了0.77、1.50和0.92,脑肿瘤分割精度相较于当前较多方法分割精度和计算效率较高,具有良好的分割性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号