首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
张建伟  陶亮  周健  王华彬 《声学技术》2015,34(5):424-430
噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。  相似文献   

2.
目的本研究旨在探究不同的作业休息制度和搜索区域移动速度对动态视觉搜索任务的搜索绩效和视觉疲劳的影响。方法采用作业休息制度(3)×搜索区域移动速度(2)二因子组内设计的人因实验进行研究。被试(N=15)在不同的作业休息制度和移动速度条件下完成视觉搜索任务。测量指标包括单次任务反应时间、各个时间节点被试的闪光融合频率和主观疲劳感受评分。结果移动速度对搜索绩效和视觉疲劳主观感受有显著影响,闪光融合频率随移动速度的增加有降低的趋势。结论高移速的搜索任务比低移速的搜索任务带来的视觉疲劳程度更高,绩效更差。作业休息制度对搜索绩效、视觉疲劳主观感受有显著影响。研究结果对动态视觉搜索作业的劳动作业休息制度设计具有指导意义。  相似文献   

3.
视觉搜索作业在生产、生活中十分常见,学界对视觉搜索绩效的影响因素作了大量研究,但是目前尚缺少关于人格特征对视觉搜索绩效影响的研究。本研究分析了MBTI(Myers Briggs type indicator)人格与任务难度(高难度、低难度)对视觉搜索绩效的影响。结果表明内倾型人格在低难度任务下的正确率显著高于外倾型人格,在两种任务难度下知觉型人格的搜索时间均显著低于判断型人格,人格特征与任务难度对搜索正确率的影响的交互效应显著。本研究结果对视觉搜索任务的作业人员选择与培训具有指导意义。  相似文献   

4.
车身板面贡献量分析作为研究车身振动对车内噪声影响的重要内容,常用声学传递向量(acoustic transfer vector,ATV)仿真计算来实现。为了进一步探究车身振动对车内语音清晰度的影响,通过对语音清晰度客观参量与主观评价分值的比较,确定以非稳态加速工况下的语言可懂度指数(speech intelligibility index,SII)为指标,运用ATV仿真手段找出对语音清晰度影响最大的面板。分析结果显示车身顶棚面板对语音清晰度影响最大。针对分析结果,采用遗传算法搜寻和ATV逆运算仿真相结合的方法,有针对性地进行了车身顶棚阻尼敷设并加以验证。结果表明,基于语音清晰度车身板面贡献情况的优化设计,有效地改善了非稳态全油门加速工况下的车内语音清晰程度,提高了车内声音品质。  相似文献   

5.
地铁站中的安检作业人员的工作是典型的视觉搜索作业,他们的作业绩效直接决定了出行乘客的人身安全。本研究以典型的地铁站安检作业环境为对象,应用实地问卷调研的方法,考察评估地铁安检作业环境中视觉、听觉干扰对工作人员的绩效、注意力的影响,调查工作人员对于其工作地的微气候环境的满意度,并评估各项可能改进措施的有效性。研究结果显示,视觉方面的工作环境隐私、语言交谈、工作地封闭程度、工作地微气候状况对工作人员影响较大,采用透明玻璃对工作地给予一定程度的封闭是一种最行之有效的措施。  相似文献   

6.
叶琪  陶亮  周健  王华彬 《声学技术》2016,35(3):254-259
为提高低信噪比环境下的语音可懂度,提出了一种基于联合失真控制的子空间语音增强算法。由于误差信号中的语音失真和残余噪声分量不能被同时最小化,同时,由语音估计器引起的语音放大失真超过6.02 d B时会严重损害语音可懂度。为此分别对语音失真和残余噪声进行最小化处理,最小化时把语音放大失真控制在6.02 d B以下作为约束条件,通过求解两个约束最优化问题得到两个不同的估计器,再对这两个估计器进行加权求和,得到一种基于联合失真控制的语音估计器。实验结果表明,相比于传统的子空间增强方法,在低信噪比环境下所提出的算法能更有效提高增强后语音的可懂度。  相似文献   

7.
王宪宇  李宏汀  马舒 《包装工程》2021,42(6):206-211
目的 对影响图标搜索绩效因素的研究进行梳理和总结.方法 从人-机-环角度,统合分析目前研究的影响因素,将其分为三大类(图标特征、任务特征、用户特征).首先从现有研究的焦点——图标特征因素介绍,将其具体分为设计元素和布局因素,并对相关研究进行梳理、分析和总结.接着从已有研究范式的角度介绍任务特征因素.最后从图标搜索主体——人的角度,分析总结与图标搜索绩效相关的影响因素.结论 随着图标类型和数量的增加,视觉搜索面临的复杂性将变大.未来,根据不同图标搜索绩效影响因素的作用机制,制定出有利于视觉搜索的图标设计规范也越来越重要.图标搜索绩效领域相关影响因素研究的结果应用潜力巨大.  相似文献   

8.
研究在高难度水平条件下,视觉突显、听觉突显和视听多通道突显对被试搜索判断绩效的影响。实验结果与分析表明:不同的突显方式对视觉搜索绩效有明显影响;在高难度水平的视觉搜索任务中,视觉突显和听觉突显均具有较好的效用性,多通道突显的效用性比单通道突显的效用性好。  相似文献   

9.
针对网页视觉设计的视觉搜索能力研究   总被引:2,自引:1,他引:2  
考察两种典型网页视觉设计形式(丰富与简练)及两种语言系统(中文与英语)对用户视觉搜索能力在搜索时间、错误及满意度三个变量上的综合性影响.28名参试者随机分为两组在两种模拟网页上执行视觉搜索任务.方差分析结果表明:①目标呈现在信息密度大、视觉冲击强的网页上时,用户搜索时间显著增加而错误及满意度并没有明显恶化;②语言因素对人们视觉搜索能力的影响并不显著.  相似文献   

10.
受集装箱堆垛高度的影响,正面吊驾驶员的视角会发生变化,视野范围也会受到一定程度的限制,为研究不同视角下正面吊驾驶员视野形状特点及动态视觉搜索绩效,通过设定4种不同仰角下的动态视野形状测定实验和动态视觉搜索实验,进行不同仰角下动态视觉测试数据处理发现:随着仰角的增加,被试视野面积及周长会逐渐减小,视野范围的圆度也相应减小,视野边界越来越粗糙;同时,视觉搜索用时会随着仰角的增大而增加,准确率也随之降低,视觉搜索绩效减小。因此,可以说明仰角会对动态视觉搜索绩效产生影响。  相似文献   

11.
张永锋  田勇  张阳 《声学技术》2015,34(1):51-53
抗噪连续语音识别是当前汉语连续语音识别的重要研究领域。采用通过度量连续语音帧之间频谱的稳定性,将连续语音切分成份,再将切分结果(无论时间长短)变换为与时间无关的大小固定的频谱空间特征,通过与模板库进行比较实现语音识别。新的频谱空间特征,与语音时长无关,同时表现出较好的抗噪声能力。在特定人连续语音识别测试系统中,取得了不错的识别效果。  相似文献   

12.
高声强声源及其应用   总被引:4,自引:0,他引:4  
谷嘉锦 《声学技术》1997,16(1):9-13
本文介绍了4种高声强声源:1.单孔旋转阀;2.带中心杆的哈特曼发声器阵;3.喷流点声源;4.喷流反馈旋转发声器。本文还给出4种声源的用途,即分别应用于:1.流动管道中有限振辐波的传播研究;2.进气道吸声内衬的声阻抗测量技术;3.风洞声学环境的研究;4.利用高强的能来清灰除尘。  相似文献   

13.
首先设计了适用于骨导语音增强的语料采集方案,采集了1 320句涵盖音节全面的语料,并制定了相应的录音规范;其次介绍了骨导语音库建立的意义,说明了语音库建立的实施方案,建成了由40个说话人录制的包括气导语音和骨导语音各8 000句的语音库;然后在对比骨导语音与气导语音声学特性的基础上,分析了骨气导语音在高频和低频的互信息量,为骨导语音的增强提供了理论依据;最后基于现阶段的研究及文中构建的语音库对今后的研究做出展望。  相似文献   

14.
一种新型的语音分析编辑合成系统   总被引:1,自引:1,他引:0  
作者根据语音研究的需要,研制了一套集语音采集,分析,合成,修改,比较,放音、调整为一体。通过参数修正,中值平滑,Hanning窗滤波,鼠标画线式,数值直接修改参数的语音分析,编辑,合成系统。该系统对语音研究来说,可以大大地缩短分析合成时间,提高效率,探导各种参数的作用,各种分析合成方法的优劣,对整个语音的研究有其使用价值。本文通过语音分析编辑合成系统的结构,功能,应用3个部分来介绍这套系统。  相似文献   

15.
设计了中型组足球机器人的比赛中应用的人机语音交互系统。首先简要介绍了相关软件,对语音识别原理进行了解析;然后分析了语音合成技术及其实现步骤,并根据足球机器人在比赛中的实际需要,设计了一套语音指令;利用Kinect软件进行了实验研究;最终针对不同的发声对象测试了多组数据,实验结果表明所设计的语音交互系统对语音指令的识别行之有效,识别率较高。无论是裁判机还是队员机,都能快速准确地识别队员的语音指令并进行播报,完全满足人机对抗赛对人机语音交互的需求。  相似文献   

16.
Abstract

This paper presents a semi‐automatic phonetic labeling method for processing in the MAT (Mandarin across Taiwan) speech database. MAT speech data are collected through the telephone networks. Each utterance has been transcribed into Chinese characters and Pinyin symbols. The proposed phonetic labeling method will mark the syllable and sub‐syllable boundaries in an utterance. Phonetic symbols are assigned to each segmented syllable. The segmentation process is accomplished by using hidden Markov modeling (HMM) and Viterbi decoding. The accuracy of syllable segmentation is detected by measuring the syllable length and the distance of a syllable from its state models. The experimental results show that the proposed labeling method can achieve segmentation accuracy around 90% for an allowed tolerance of 16 ms.  相似文献   

17.
18.
驾驶员语音增强质量的评价指标是保证语音增强算法性能的关键,而现有的语音增强质量评价方法不能准确地反映人对声音感知的主观性。针对上述问题,分析了言语可懂度指数对语音增强算法评价的适用性,并在某品牌汽车上进行实验。通过在汽车内建立均匀线性传声器阵列来对驾驶员语音进行信号采集,然后利用波束形成算法对阵列中不同传声器组合的语音信号进行增强,得到汽车在不同行驶速度时不同阵列组合的语音增强结果。使用信噪比和言语可懂度指数分别对实验得到的语音增强结果进行评价,结果表明言语可懂度指数更适合评价汽车内驾驶员的语音增强算法的性能。  相似文献   

19.
文章讨论了一种新的基于回波分离算法的改进算法,并将其应用于室内有较强混响干扰下的语音定向。算法在有效语音片段检出时,不仅采用了回波估计,还同时考虑了语音特征,最后利用数字波束形成法来计算检出的有效语音片段的方位角,并且,回波估计是在语音短时能量分析的基础上进行的。试验表明,所获得的精度和人耳定向精度相接近。  相似文献   

20.
黄程韦  金赟  赵艳  于寅骅  赵力 《声学技术》2010,29(4):396-399
针对实用语音情感研究的需要,设计并且建立了诱发语音情感数据库。根据刺激评估表,设计了一种基于计算机游戏的情感诱发方式,首次针对汉语音的实用语音情感进行了情感数据的采集和情感语音库的建立。对烦躁、紧张和喜悦等三种具有实际应用意义的语音情感进行了有效的诱发,录制了情感语音数据,并进行了数据的检验与听辩测试。结果显示,采用计算机游戏诱发情感的方法能够有效地采集自然度较高的实用语音情感数据,为实用语音情感的特征分析与识别提供了必要的研究基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号