共查询到10条相似文献,搜索用时 31 毫秒
1.
本文设计了一种高速的语音数据采集卡,给出了语音数据采集系统的总体设计框图,完成硬件电路原理图的设计并绘制PCB板.语音采集系统的软件设计包括固件程序设计、USB设备驱动程序开发和应用程序界面开发.该采集卡使用TI公司的C6000系列高性能DSP芯片作为系统核心,通过USB2.0接口来完成与计算机的高速数据传输,可实现将语音数据送到计算机进行存储和将语音数据传回板卡进行回放的功能. 相似文献
2.
为解决语音AI 的方言语音数据采集存在的数据量不够多、样本分布不均衡等问题,以语音数据收集、标注、数据交叉校验、数据集打包分享为目标,设计开发了一个语音数据采集与服务平台,提供语音数据采集、任务定制、语音与文本数据管理、数据标注、数据检索、数据下载等功能,通过微信小程序和手机APP吸引用户参与有趣的语音游戏,从而实现可定制的语音数据采集、标注、交叉校验等工作,在提升语音数据量的同时,有效解决数据采集过程中的样本分布不均衡问题,提升语音数据在方言人群和地域方面覆盖范围,提升数据质量,助力方言语音识别。 相似文献
3.
4.
语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样本交给用户进行标注,以便利用少量高质量的训练样本构建与大数据量训练方式一样精准的识别模型。研究了基于主动学习的藏语拉萨话语音语料选择方法,提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。 相似文献
5.
6.
在工业控制系统中,为实现故障的快速排查、生产过程的监控和工艺数据的实时记录,需要建立一套快速的数据采集、监控、记录和分析系统。基于系统数据量大、采样周期短(ms级)并且要求数据同步的需求,使用PADU设计并实现了一种光纤架构的实时数据采集和记录的系统和方法。经过实践检验,能够完成大量分布式数据的同步采集。 相似文献
7.
针对情感变异的语音分类与识别研究的需要,给出了情感变异的语音语料库的构建流程和制作规范,设计并建立了情感变异的语音语料库。现已录制的语料包含自然、高兴、悲伤和愤怒四种情感类型,共1 600条语句。为了证明该情感变异的语音语料库的有效性,对其所有数据进行了听辨实验检测。结果表明,设计并构建的情感变异的语音语料库具有较高的实用价值,为情感变异的语音的分类与识别的研究奠定了夯实的基础。 相似文献
8.
提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注. 相似文献
9.
针对情感变异的语音分类与识别研究的需要,给出了情感变异的语音语料库的构建流程和制作规范,设计并建立了情感变异的语音语料库。现已录制的语料包含自然、高兴、悲伤和愤怒四种情感类型,共1 600条语句。为了证明该情感变异的语音语料库的有效性,对其所有数据进行了听辨实验检测。结果表明,设计并构建的情感变异的语音语料库具有较高的实用价值,为情感变异的语音的分类与识别的研究奠定了夯实的基础。 相似文献