期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王凯马明栋《计算机技术与发展》2021,(1)

人工智能技术是当前计算机科学的研究热点,人机通信是人工智能技术的重要组成之一。作为人机通信主要方法之一的语音交互也一直是科学家的研究热点,语音交互技术的关键是语音识别。而目前大多语音识别软件要么功能单一,要么价格昂贵,Kaldi作为新兴的开源语音识别工具,凭借其强大的功能和简单的获取渠道逐渐流行。该文介绍了语音识别技术的发展历程,Kadli软件的基本架构和其所具有的独特优势,语音识别的一般处理流程,多层神经网络的基本结构以及多层神经网络在语音识别当中的应用。对基于Kaldi软件当中的HMM-DNN模型,使用中文数据集训练该模型,搭建一个完整的语音识别系统。通过该系统,不仅能展现出Kaldi软件丰富强大的功能,同时也为语音识别研究人员选择合适的工具提供了新的思路。相似文献

2.

基于语音识别的语音保密信息监管算法

赵恺捷朱永强郑焓项倩红《网络安全技术与应用》2022,(6):36-38

针对当前保密监管的技术现状,本文分析了当前保密信息监管的主要监管范围及其局限性,提出并论述了语音信息保密监管的必要性与重要性,同时对语音信息保密监管的核心技术——语音识别技术的基本原理进行了分析,对语音信息保密监管的具体方法及技术路线进行了讨论,选择基于大规模连续语音识别的方法作为语音信息保密监管的底层支撑技术,并在此基础之上提出一种基于置信度的语音信息保密监管匹配算法,通过同音词扩展的方法提升监管数据的召回率,通过类别置信度计算的方法提升召回监管数据的准确率,以实现在提升监管数据召回率的同时,更好的兼顾监管的准确率。相似文献

3.

深度学习在语音识别中的研究进展综述 总被引：1，自引：0，他引：1

侯一民周慧琼王政一《计算机应用研究》2017,34(8)

在如今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借着其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。首先主要分析和总结了当前几种具有代表性的深度学习模型;其次是其在语音识别中对于语音特征提取及声学建模中的应用;最后总结了当前所面临的问题和发展方向。相似文献

4.

支持表情细节的语音驱动人脸动画

范懿文夏时洪《计算机辅助设计与图形学学报》2013,25(6)

针对语音驱动人脸动画中如何生成随语音运动自然呈现的眨眼、抬眉等表情细节以增强虚拟环境的沉浸感的问题,提出一种可以合成表情细节的语音驱动人脸动画方法.该方法分为训练与合成2个阶段.在训练阶段,首先对富有表情的三维人脸语音运动捕获数据特征进行重采样处理,降低训练数据量以提升训练效率,然后运用隐马尔可夫模型(HMM)学习表情人脸语音运动和同步语音的关系,同时统计经过训练的HMM在训练数据集上的合成余量;在合成阶段,首先使用经过训练的HMM从新语音特征中推断与之匹配的表情人脸动画,在此基础上,根据训练阶段计算的合成余量增加表情细节.实验结果表明,文中方法比已有方法计算效率高,合成的表情细节通过了用户评价验证. 相似文献

5.

基于DirectX技术的语音编解码系统的实现 总被引：4，自引：0，他引：4

肖勇军金伟正《计算机工程》2005,31(8):180-182

分析了DirectX技术和G723.1协议编解码算法的特点,提出了利用软件进行语音数据编解码的方案。介绍了如何使用DirectSound技术实现音频的捕获和回放以及和视频处理部分相结合构成一个完整的视频会议系统的方法。相似文献

6.

基于DCT域实时语音的信息隐藏方法

王昌达马登峰《计算机工程与设计》2012,33(2):474-478,555

为了满足对秘密信息的实时性的需求,提出一种基于DCT域实时语音的信息隐藏方法.该方法使用DirectSound 对实时的语音进行捕获,依据人类听觉系统的掩蔽效应,选择DCT中的高频系数,通过量化秘密的音频信息将其嵌入到捕获的原始语音中,通过Socket技术对语音进行实时的传输,并且在秘密信息的提取过程中不需要原始音频载体信息的参与,实现秘密信息的盲提取.实验结果表明,在网络较好的情况下可以有效地借助实时的语音传递秘密信息. 相似文献

7.

语音短时分析与合成的滤波器实现

《信息与电脑》2019,(15)

频谱分析技术在语音信号处理中得到了广泛应用。短时频谱分析是各种语音频域处理方法的基础,广泛应用于语音编解码、语音合成、语音识别等领域。通过时频分析理论,对语音短时频谱分析与合成进行理论推导,表明语音短时频谱分析与合成可以通过加窗和滤波语音信号实现,并据此提出具体算法,按照该算法处理实际语音数据。合成语音与原始语音相比,差异很小。相似文献

8.

VOC语音文件格式分析及应用

李学春苟列红《中国计算机用户》1995,(5):54-55

随着多媒体技术的发展,语音文件的应用越来越广泛,而语音文件的存储格式又是多种多样的,为了充分利用各种语音工具的特点,以及在开发软件中使用语音技术,就需要了解它们的格式,从而进行语音格式的相互转换,对语音数据进行处理和播放。语音文件常见的格式有VOC、WAV和AU等,而VOC语音文件是现在声霸卡和语音采集卡的主要存储格式,本文分析了VOC语音文件的特点和压解方法,并用Turbo C编制了在没有声霸卡支持下,用一般PC机的扬声器来实现VOC语音文件的播放方法。相似文献

9.

基于DirectSound和Winsock的实时语音通信

陈湘国贾东立韩昱马小进《福建电脑》2006,(8):102-103

本文主要介绍了使用DirectSound和Winsock进行语音捕获、实时传输和回放的实现方法．并对实现步骤进行了具体的分析。相似文献

10.

基于DirectSound的火电厂语音报警系统

刘颖《数字社区&智能家居》2010,(2):455-456,459

在分析火电厂报警系统实际需要和现有系统不足的基础上,给出了火电厂语音报警系统的硬件结构和软件组成．重点分析了DirectSound技术在语音报警系统中的应用,给出了语音捕获、声音输出的一般方法和结合内存映射文件提高系统性能的方法。实际应用表明,基于DirectSound的语音报警系统性能优良,具有较好的实用价值。相似文献

11.

具有混音功能的新型语音卡设计与实现

许松伟胡晓吉《计算机测量与控制》2015,23(10):64-64

为满足某控制系统实时记录语音和播放录音的实际需求,基于语音压缩编码技术,以现场可编程门阵列(FPGA)为控制核心,设计实现了16个通道采集语音信号,进行ADPCM编码,将语音文件以WAVE格式存储,集监听、播放指定语音通道及任意时间段录音于一体的紧凑型PCI(CPCI)板卡。该板卡区别于传统语音卡的创新点在于运用语音叠加技术使板卡具有混音功能,能够将不同通道语音混音、记录存储,同时具有压缩比可自由选择的功能。详细介绍了板卡的组成机构、工作原理、硬件设计和软件设计。最后进行实验测试,板卡语音存储、语音回放等各项功能正常,音质良好,验证了设计方案的可行性与实用性。相似文献

12.

SOPC技术在DCS系统语音报警中的应用

衷卫声刘禄仁《控制工程》2012,19(2):351-354

针对DCS系统外接蜂鸣器声音小、报警级别和部位不易区分,可靠性差等问题,提出了一种基于Nios II的语音报警系统。报警音频将包含报警的详细信息,并预先存放于SD卡中。当警报出现时,系统将根据报警信号触发SD卡中相应的语音警示工作人员采取措施。本设计基于SOPC技术,主要包括软硬件设计2个主要部分。硬件部分构建了控制核心,实现系统与外设的接口;软件部分主要通过SPI,I2C协议,实现了外设的配置以及对音频文件管理、读取和传输,最终实现音频解码与播放。相似文献

13.

飞机舱音记录器中话语声和开关声小波分析

程道来仪垂杰郭海荣姚红宇《计算机工程与应用》2006,42(25):187-189,196

针对舱音译码系统“辨听”的不足,提出了基于计算机音频原理和专用软件的改进性舱音译码系统的舱音中话语声和开关声的声频特征获取方法;然后根据话语声和开关声是含有噪声的非平稳信号的特点,并依据小波变换理论提出了一维离散二进制Daubechies小波函数db1三尺度小波分解方法,对话语声和开关声降噪并进行深入处理,得到频率—能量幅值等更多信息,结果有利于掌握飞机飞行状态,调查飞机事故原因,也为分析同类舱音信号提供了参考依据。相似文献

14.

Audition在《数字影像制作》教学中的应用

尹敬齐《计算机与网络》2009,(13):69-72

Audit ion是集音频录制、混合、编辑和控制于一身的音频处理软件。它功能强大,控制灵活。使用它可以录制、混合、编辑和控制数字音频文件,也可轻松创建音乐、制作广播短片、修复录制缺陷。通过与Adobe视频软件的智能集成,还可将音频和视频的制作流程结合在一起。使用hudition,将获得实时的专业级效果。相似文献

15.

基于DirectSound技术的音频捕获与多路混音的实现

苑春苗杨清永《计算机工程与设计》2007,28(3):613-614,634

给出了一个如何使用DirectSound技术实现音频流的捕获并实现网络上多路声音混合的方案.该方案通过DirectSound提供的缓冲机制实现了音频流的捕获,结合网络技术和辅助缓冲技术可实现网络上多路声音的混合,提高了音频处理的效率和通用性.阐述了DirectSound的相关技术,给出了系统的框架图及音频捕获与混音的实现方法,提出了环形缓冲区设计方案,最后给出了系统优化方案. 相似文献

16.

适用于总线控制的语音播报系统开发

马殷元廖理谢文洋《测控技术》2014,33(11):93-96

针对目前的语音播报设备不能适用于标准的总线拓扑控制且不能对其语音文件、语音表单信息在线更新等缺点,开发了其中适用于总线控制的语音播报系统。通过分析其功能需求选用STC12LE5A60S2为控制核心、WT588D为语音解码器和TPA3112D1为语音功率放大芯片,运用分层设计模式、低功耗设计及互换性设计理念,使其可在基于RS485总线的Modbus-RTU、Modbus-ASCII或自定义协议等上组网。然后给出了相关硬件结构图、原理图、程序结构图及部分流程图等。在组态软件等组成的测试环境和某客车地面电源管理系统中的实际应用情况,表明了该实现方案的可行性及可推广性。相似文献

17.

基于Authorware的wave音频播放器的设计

刘林涛田慧珍《数字社区&智能家居》2006,(29)

介绍了如何使用Authorware开发一个播放wave音频文件的播放器。通过这一设计,意在抛砖引玉,帮助大家在多媒体软件开发中,提高对包括声音在内的多媒体信息的处理能力和软件交互性的设计能力。相似文献

18.

基于MP3播放器及数码录音笔的音频信号源

朱建新李坤何晓秋林春辉李亮《自动化技术与应用》2012,31(10):72-77

针对传统信号源产生的波形固定、单一及体积大、造价高、携带不便等问题,本文提出了一种基于MP3播放器及数码录音笔的音频信号源设计方案。通过MP3播放器及数码录音笔的直录接口和USB端口录入可以实现多种信号波形的存储、调用。本文主要介绍了仪器的工作原理及设计方案,对相关电路给出了测试数据。相似文献

19.

快速练级攻略

刘林涛田慧珍《数字社区&智能家居》2006,(10):116-117

那么，在玩家初步了职业分化和游戏特色内容以后，就可以进入游戏中开始自己的武林征程了，由于笔者内测体验有限，仅以30级以前的游戏经历与大家共享。相似文献