首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
朱唯鑫  郭武 《信号处理》2016,32(7):859-865
本文首次提出了长度规整的最大后验估计(MAP)方法,并将其应用到说话人分割聚类中的交叉似然比(CLR)和T Test这两种度量距离上。传统的MAP方法需要在通用背景模型(UBM)基础上进行统计量的计算,进而对模型参数进行自适应偏移,因此偏移的程度与语音片段的长度正相关。当在度量两个长度不相同的语音片段的相似性时,传统的MAP方法会使得说话人模型刻画不准确,从而影响距离度量。本文在MAP过程中,根据语音的长度对相关因子进行规整,然后再进行模型参数的调整,从而使得模型参数与语音长度无关,更能体现说话人的身份信息。在中文多人电视访谈节目数据的分割聚类评测任务上,采用长度规整的MAP方法相对于传统方法都有明显提升,在CLR度量准则下分割聚类错误率相对下降了35%,在T Test度量准则下分割聚类错误率相对下降了107%。   相似文献   

2.
基于聚类统计与文本无关的说话人识别研究   总被引:6,自引:2,他引:4  
从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种裂合并的聚类算法,并用于与本文无关的说话人识别研究,初步建立了基于聚类统计的开放系统,该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行了模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实践研究中,研究了特征矢量的加权,语音段的时长以及a因子的选择对系统性能的影响。  相似文献   

3.
电视新闻节目的深度报道作为新闻节目的重心,在电视新闻节目中的地位是无可取代的。然而,电视新闻节目的深度报道在由起步走向成熟的过程中,也会遇到一些问题。笔者对当前电视新闻节目深度报道的特点进行了分析,并阐述了电视新闻节目进行深度报道的方法,以期为电视新闻节目的深度报道提供参考。  相似文献   

4.
在新兴网络以及传统媒体的冲击和影响下进行地方台新闻节目定位分析,有利于促进地方电视新闻节目的长效发展,对于推动地方电视新闻节目的发展有积极作用。笔者在对地方台电视新闻节目中存在问题的分析基础上,结合地方电视新闻节目特征,对其节目定位进行分析思考,以提升地方电视新闻节目的竞争力,促进地方电视新闻节目长效发展。  相似文献   

5.
该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。  相似文献   

6.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。  相似文献   

7.
杨毅  宋辉  刘加 《电子与信息学报》2011,33(5):1234-1237
该文针对美国国家标准与技术研究院(NIST)的 NIST评测,构建了一套多距离麦克风说话人分类及定位语音处理系统,针对NIST富标注评测中提出的说话人分类问题,提出改进的结合时延估计和聚类的说话人分类方法,在保证稳定性的前提下降低说话人分类的复杂度并提高准确率;提出一种新的相邻阵元间时延构造矩阵方程算法,可得到多个说话人的方向角。实验在标准会议环境下采集真实语音数据进行算法验证,说话人分类算法的正确率接近目前主要说话人分类系统的正确率,定位方向角误差在3以内。实验结果说明,适当条件下多距离麦克风系统可作为合适的语音信号输入设备应用于多人多方会议环境。  相似文献   

8.
马勇  鲍长春 《信号处理》2013,29(9):1190-1199
说话人分割聚类是近几年新兴起的语音信号处理研究方向,它主要研究如何确定连续语流中多说话人起止时间的位置,并标出每个语音段对应的说话人。这项研究对自动语音识别、多说话人识别和基于内容的音频分析等都具有重要的意义。根据说话人分割和聚类实现过程不同,本文从异步策略和同步策略的角度回顾了十年来国内外研究的主流算法、技术和代表系统,对比了不同代表系统在近几年NIST富信息转写评测的结果,最后讨论了目前还存在的问题,并对未来的发展进行了展望。   相似文献   

9.
王博 《西部广播电视》2018,(16):148-148
随着网络技术的迅猛发展以及信息革命步伐的不断加快,电视新闻节目的形式及内容都较之以往有所不同。电视新闻节目历来是新闻报道和消息传递的主要阵地,其主要依靠节目主持人这一载体发挥报道新闻这一社会作用。新闻节目主持人通过自身语言这一媒介向社会公众传播社会上的热点事件,其在电视新闻节目中扮演着"排头兵"的角色。在新时期,社会环境变化加快,一些新鲜的词汇进入到新闻节目主持领域,对新闻节目主持人而言既是机遇,又是挑战。本文通过探讨新闻节目主持人在报道新闻时存在的语言问题,进而提出相应建议,以期对新闻节目主持人报道新闻有所助益。  相似文献   

10.
一种改进的模糊C-均值聚类算法在说话人识别中的应用   总被引:3,自引:0,他引:3  
杨彦  赵力 《电声技术》2006,(1):40-43
提出了一种将改进的FCM聚类算法与矢量量化相结合的说话人识别的方法。先从语音信号中提取待识别的特征矢量集,再利用矢量量化来设计码本,最后用改进的算法对待识别语音进行辩识。该算法解决了FCM算法对初始值敏感、易陷入局部最优的问题。所使用的特征参数较少,计算比较简单,但识别率较高,且具有较好的鲁棒性。  相似文献   

11.
本文采用多模态检索、向量数据库等能力驱动新闻大数据价值挖掘,在线索发现、选题策划、素材准备、发布效果分析、内容策划评估等方面推动生产流程机制创新,在一定程度上提升了媒体工作者工作效率和新闻内容效果评估能力,可使媒体工作站更专注新闻媒体产品的策划思考和高品质创作.  相似文献   

12.
记者是电视新闻节目的核心人物,把控着整个节目的质量和走向。如今的时代飞速发展,手机、网络等一系列新媒体相继诞生,这无疑对传统电视新闻节目带来了一定的影响。记者作为一名新闻媒体的记录者,在面对新形势、新时代、新媒体背景的情况下,应该如何提高自身的职业素养成为了一个亟待研讨的话题。文章主要新媒体背景下电视新闻记者的职业素养展开探究。  相似文献   

13.
为了适应电视栏目的改版,采用电视图文点评播报系统和VGA转VIDEO信号转换器,与演播室原有视频系统相连接,采用色键和DPM相结合,使报纸、刊物、图片、流媒体的新闻资料直接应用到电视栏目中,拓展了电视节目的表达形式,丰富了节目内容,取得了较好的效果。  相似文献   

14.
新闻视频字幕是新闻视频数据中所包含的固有信息,是实现自动化视频检索的重要信息源,运用X^2直方图匹配法检测突变镜头,再通过C-均值聚类算法标识出新闻字幕,可以准确提取出新闻字幕,利用新闻视频字幕进行新闻视频检索,可以克服现有硬件设备的局限性,提高检索的速度和准确性,进而提高数字电视的人机交互性。  相似文献   

15.
本文设计与实现了一个全自动中文新闻字幕生成系统,输入为新闻视频,输出为视频对应的字幕文本.以<新闻联播>为语料,实现了音频提取、音频分类与切分、说话人识别、大词汇量连续语音识别、视频文件的播放和文本字幕的自动生成等多项功能.新闻字幕的自动生成,避免了繁重费时的人工字幕添加过程.实验表明,该系统识别率高,能够满足听障等特...  相似文献   

16.
针对新闻视频中精品小栏目的点播需要靠人工剪辑,费时费力,提出了一种基于时空切片的片花检索方法。该方法根据片花的特点过滤掉大部分不相关的镜头,然后通过镜头合并规则得到候选片段,最后将候选片段融合为时空切片,并在候选片段时空切片的基础上采用分块主色调特征和纹理特征相结合的方法得到最后的相似片段。实验从查全率和定位精度两方面证明了该方法的有效性。  相似文献   

17.
This paper describes the techniques in threading and autodocumenting news stories according to topic themes. Initially, we perform story clustering by exploiting the duality between stories and textual-visual concepts through a co-clustering algorithm. The dependency among stories of a topic is tracked by exploring the textual-visual novelty and redundancy of stories. A novel topic structure that chains the dependencies of stories is then presented to facilitate the fast navigation of the news topic. By pruning the peripheral and redundant news stories in the topic structure, a main thread is extracted for autodocumentary  相似文献   

18.
浅谈演播室直播的安全策略   总被引:1,自引:0,他引:1  
随着电视现场直播这种手段在现代电视传媒的应用越来越广泛,保障现场直播的安全显得尤为重要,它在一定程度上体现了电视台的节目制作能力和技术水平,已成为所有电视台永恒的追求目标。结合太原电视台新闻频道用于新闻直播的演播室系统的实际应用情况,分别从系统的设计(包括视频、音频、灯光、电源、计算机等)和使用的角度阐述了有效提高演播室直播安全系数的经验和体会。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号