首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
本文设计了一种高速的语音数据采集卡,给出了语音数据采集系统的总体设计框图,完成硬件电路原理图的设计并绘制PCB板.语音采集系统的软件设计包括固件程序设计、USB设备驱动程序开发和应用程序界面开发.该采集卡使用TI公司的C6000系列高性能DSP芯片作为系统核心,通过USB2.0接口来完成与计算机的高速数据传输,可实现将语音数据送到计算机进行存储和将语音数据传回板卡进行回放的功能.  相似文献   

2.
为解决语音AI 的方言语音数据采集存在的数据量不够多、样本分布不均衡等问题,以语音数据收集、标注、数据交叉校验、数据集打包分享为目标,设计开发了一个语音数据采集与服务平台,提供语音数据采集、任务定制、语音与文本数据管理、数据标注、数据检索、数据下载等功能,通过微信小程序和手机APP吸引用户参与有趣的语音游戏,从而实现可定制的语音数据采集、标注、交叉校验等工作,在提升语音数据量的同时,有效解决数据采集过程中的样本分布不均衡问题,提升语音数据在方言人群和地域方面覆盖范围,提升数据质量,助力方言语音识别。  相似文献   

3.
目前深度学习在医学图像分析领域取得的良好表现大多取决于高质量带标注的数据集, 但是医学图像由于其专业性和复杂性, 数据集的标注工作往往需要耗费巨大的成本. 本文针对这一问题设计了一种基于深度主动学习的半自动标注系统, 该系统通过主动学习算法减少训练深度学习标注模型所需的标注样本数量, 训练完成后的标注模型可以用于剩余数据集的标注工作. 系统基于Web应用构建, 无需安装且能跨平台访问, 便于用户完成标注工作.  相似文献   

4.
语音识别模型需要大量带标注语音语料进行训练,作为少数民族语言的藏语,由于语音标注专家十分匮乏,人工标注语音语料是一件非常费时费力的工作。然而,主动学习方法可以根据语音识别的目标从大量未标注的语音数据中挑选一些具有价值的样本交给用户进行标注,以便利用少量高质量的训练样本构建与大数据量训练方式一样精准的识别模型。研究了基于主动学习的藏语拉萨话语音语料选择方法,提出了一种临近最优的批量样本选择目标函数,并验证了其具有submodular函数性质。通过实验验证,该方法能够使用较少的训练数据保证语音识别模型的精度,从而减少了人工标注语料的工作量。  相似文献   

5.
情感语料库的构建和分析   总被引:4,自引:0,他引:4  
本文介绍了情感语料库构建方面的一些经验,讨论了在设计和建设情感语料库中的几个基本问题制定标注规范、选择标注集、设计标注工具以及标注过程中的质量监控。目前已经标注完成近4万句,100万字的语料。在完成这些已标注语料的基础上,进一步给出了语料库的情感分布,情感迁移规律等统计数据,分析了情感语料库的特点及应用。它的建成将为文本情感计算提供更加强大的资源支持。  相似文献   

6.
吕丹枝  徐静 《自动化仪表》2007,28(11):38-39,42
在工业控制系统中,为实现故障的快速排查、生产过程的监控和工艺数据的实时记录,需要建立一套快速的数据采集、监控、记录和分析系统。基于系统数据量大、采样周期短(ms级)并且要求数据同步的需求,使用PADU设计并实现了一种光纤架构的实时数据采集和记录的系统和方法。经过实践检验,能够完成大量分布式数据的同步采集。  相似文献   

7.
针对情感变异的语音分类与识别研究的需要,给出了情感变异的语音语料库的构建流程和制作规范,设计并建立了情感变异的语音语料库。现已录制的语料包含自然、高兴、悲伤和愤怒四种情感类型,共1 600条语句。为了证明该情感变异的语音语料库的有效性,对其所有数据进行了听辨实验检测。结果表明,设计并构建的情感变异的语音语料库具有较高的实用价值,为情感变异的语音的分类与识别的研究奠定了夯实的基础。  相似文献   

8.
提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注.  相似文献   

9.
针对情感变异的语音分类与识别研究的需要,给出了情感变异的语音语料库的构建流程和制作规范,设计并建立了情感变异的语音语料库。现已录制的语料包含自然、高兴、悲伤和愤怒四种情感类型,共1 600条语句。为了证明该情感变异的语音语料库的有效性,对其所有数据进行了听辨实验检测。结果表明,设计并构建的情感变异的语音语料库具有较高的实用价值,为情感变异的语音的分类与识别的研究奠定了夯实的基础。  相似文献   

10.
汉语普通话语音合成语料库TH-CoSS的建设和分析   总被引:6,自引:0,他引:6  
本文介绍了汉语语音合成语料库TH-CoSS的建设和分析。本语料库包括男女声朗读语句约2万个。语料库分为四个部分: TTS系统建库用语句、TTS系统测试用语句、特殊语调语句和特殊音节组。语料设计考虑了语料的平衡和音段、韵律信息的丰富。语料库中除了文本、语音数据外,还带有音段切分标志,标注文件采用XML格式。为了方便语音分析与开发,特研制了标注软件。本文还给出了语境特征对语音韵律影响的分析结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号