共查询到10条相似文献,搜索用时 15 毫秒
1.
1.引言识别(Keyword Spotting,简称KWS)的任务是从连续无限制的语音中,识别给定的若干个词.它与通常所说的连续语音识别(Continuous Speech Recognition,简称CSR)有密切的联系,但又有显著的区别.所以,在语音识别的研究中,KWS与CSR通常是作为两个不同的问题来处理[1,2]. 相似文献
3.
基于语音识别的关键词识别方法增大了关键词识别工作量,降低了识别效率,还使得识别准确率受语音识别和文字查找办法影响,并对无文字语言不适用.针对此问题,提出将Wasserstein生成式对抗网络(WGAN)应用于语音关键词识别中,利用生成器输出的生成序列分析语音中有无关键词.为了获取语音中关键词的位置信息,该文为WGAN网... 相似文献
4.
语音识别技术展望 总被引:1,自引:0,他引:1
<正> 自从ENIAC问世之后,立即有人想到要让计算机听懂人说话,并开始了这方面的研究工作。所以说,语音识别的研究历史与计算机的发展历史一样长。计算机的发展已历经了从电子管到晶体管以至超大规模集成电路的好几代,单单微机的CPU就从早期的4004发展到今天的奔腾三代,涌入了普通家庭,已与我们的数字化生活密不可分。但是,与计算机同步发展的语音识别技术似乎并不遵循摩尔规律,它的产品也迟迟未能进入市场。时至今日,语音技术产品的市场日益升温,语音识别技术已经成为计算机进一步在亿万百姓中普及的关键技术,也必将成为信息产业的标志性技术和未来计算机的重要特征。 相似文献
6.
8.
1 引言自然人机交互方式使得人同计算机的交流不再局限于键盘、鼠标等外设.而是通过语言及手势、表情、唇动等形体语言来进行,从而使得人机交互变得像人与人之间的交流一样轻松自如。唇读通常被视为说话过程中伴随的辅助信息,它有助于对说话者提供信息的更准确理解,减弱噪音干扰。计算机唇读是指通过建立口型模型和分析运动参数,定量地处理唇动信息辅助进行语音识别,或者是直接对序列图像进行分类和识别。发音是一个唇部和喉部肌肉连续运动的过程,人在发相同的音时,肌肉运动是极为相似的。构成运动的各个状态的描述是问题的关键。描述不同的状态就必须明确各种口型。因此 相似文献
9.
在不久的将来,PC机将成为提供基本的计算服务的智能化的小盒子,该计算服务可以通过Internet得到实时的服务。你购买的小盒子将包含一个计算代理,它可以根据你的需求在网络上为你找到合适的资源。技术的进步会使每个人都能够很方便地使用计算机。 相似文献