共查询到20条相似文献,搜索用时 78 毫秒
1.
噪声谱估计是单通道语音增强算法的关键步骤,当前大部分语音增强算法旨在提高语音质量,提高语音可懂度的算法却很少。在传统的单通道语音增强算法中,语音质量的提高往往是以牺牲语音的可懂度为代价的。对目前主流的几种噪声谱估计算法对语音可懂度影响进行分析。在不同噪声背景、不同信噪比情况下进行噪声谱估计,并采用谱减法对含噪语音信号作去噪处理,对比分析不同噪声、不同信噪比下增强前后语音的短时客观可懂度(Short-Time Objective Intelligibility,STOI)值,最后根据信噪比,对比分析了不同噪声环境下,语音增强前后语音能量高于噪声能量的时频块所占比例。实验表明,相比其他噪声估计算法,最小统计(Minima Statistics,MS)算法由于保留了更多的以语音能量为主的时频块,使得去噪后的语音有较高的可懂度。 相似文献
2.
《人类工效学》2020,(2)
目的本研究旨在探究不同的作业休息制度和搜索区域移动速度对动态视觉搜索任务的搜索绩效和视觉疲劳的影响。方法采用作业休息制度(3)×搜索区域移动速度(2)二因子组内设计的人因实验进行研究。被试(N=15)在不同的作业休息制度和移动速度条件下完成视觉搜索任务。测量指标包括单次任务反应时间、各个时间节点被试的闪光融合频率和主观疲劳感受评分。结果移动速度对搜索绩效和视觉疲劳主观感受有显著影响,闪光融合频率随移动速度的增加有降低的趋势。结论高移速的搜索任务比低移速的搜索任务带来的视觉疲劳程度更高,绩效更差。作业休息制度对搜索绩效、视觉疲劳主观感受有显著影响。研究结果对动态视觉搜索作业的劳动作业休息制度设计具有指导意义。 相似文献
3.
视觉搜索作业在生产、生活中十分常见,学界对视觉搜索绩效的影响因素作了大量研究,但是目前尚缺少关于人格特征对视觉搜索绩效影响的研究。本研究分析了MBTI(Myers Briggs type indicator)人格与任务难度(高难度、低难度)对视觉搜索绩效的影响。结果表明内倾型人格在低难度任务下的正确率显著高于外倾型人格,在两种任务难度下知觉型人格的搜索时间均显著低于判断型人格,人格特征与任务难度对搜索正确率的影响的交互效应显著。本研究结果对视觉搜索任务的作业人员选择与培训具有指导意义。 相似文献
4.
车身板面贡献量分析作为研究车身振动对车内噪声影响的重要内容,常用声学传递向量(acoustic transfer vector,ATV)仿真计算来实现。为了进一步探究车身振动对车内语音清晰度的影响,通过对语音清晰度客观参量与主观评价分值的比较,确定以非稳态加速工况下的语言可懂度指数(speech intelligibility index,SII)为指标,运用ATV仿真手段找出对语音清晰度影响最大的面板。分析结果显示车身顶棚面板对语音清晰度影响最大。针对分析结果,采用遗传算法搜寻和ATV逆运算仿真相结合的方法,有针对性地进行了车身顶棚阻尼敷设并加以验证。结果表明,基于语音清晰度车身板面贡献情况的优化设计,有效地改善了非稳态全油门加速工况下的车内语音清晰程度,提高了车内声音品质。 相似文献
5.
地铁站中的安检作业人员的工作是典型的视觉搜索作业,他们的作业绩效直接决定了出行乘客的人身安全。本研究以典型的地铁站安检作业环境为对象,应用实地问卷调研的方法,考察评估地铁安检作业环境中视觉、听觉干扰对工作人员的绩效、注意力的影响,调查工作人员对于其工作地的微气候环境的满意度,并评估各项可能改进措施的有效性。研究结果显示,视觉方面的工作环境隐私、语言交谈、工作地封闭程度、工作地微气候状况对工作人员影响较大,采用透明玻璃对工作地给予一定程度的封闭是一种最行之有效的措施。 相似文献
6.
为提高低信噪比环境下的语音可懂度,提出了一种基于联合失真控制的子空间语音增强算法。由于误差信号中的语音失真和残余噪声分量不能被同时最小化,同时,由语音估计器引起的语音放大失真超过6.02 d B时会严重损害语音可懂度。为此分别对语音失真和残余噪声进行最小化处理,最小化时把语音放大失真控制在6.02 d B以下作为约束条件,通过求解两个约束最优化问题得到两个不同的估计器,再对这两个估计器进行加权求和,得到一种基于联合失真控制的语音估计器。实验结果表明,相比于传统的子空间增强方法,在低信噪比环境下所提出的算法能更有效提高增强后语音的可懂度。 相似文献
7.
目的 对影响图标搜索绩效因素的研究进行梳理和总结.方法 从人-机-环角度,统合分析目前研究的影响因素,将其分为三大类(图标特征、任务特征、用户特征).首先从现有研究的焦点——图标特征因素介绍,将其具体分为设计元素和布局因素,并对相关研究进行梳理、分析和总结.接着从已有研究范式的角度介绍任务特征因素.最后从图标搜索主体——人的角度,分析总结与图标搜索绩效相关的影响因素.结论 随着图标类型和数量的增加,视觉搜索面临的复杂性将变大.未来,根据不同图标搜索绩效影响因素的作用机制,制定出有利于视觉搜索的图标设计规范也越来越重要.图标搜索绩效领域相关影响因素研究的结果应用潜力巨大. 相似文献
8.
9.
针对网页视觉设计的视觉搜索能力研究 总被引:2,自引:1,他引:2
考察两种典型网页视觉设计形式(丰富与简练)及两种语言系统(中文与英语)对用户视觉搜索能力在搜索时间、错误及满意度三个变量上的综合性影响.28名参试者随机分为两组在两种模拟网页上执行视觉搜索任务.方差分析结果表明:①目标呈现在信息密度大、视觉冲击强的网页上时,用户搜索时间显著增加而错误及满意度并没有明显恶化;②语言因素对人们视觉搜索能力的影响并不显著. 相似文献
10.
11.
12.
13.
14.
15.
设计了中型组足球机器人的比赛中应用的人机语音交互系统。首先简要介绍了相关软件,对语音识别原理进行了解析;然后分析了语音合成技术及其实现步骤,并根据足球机器人在比赛中的实际需要,设计了一套语音指令;利用Kinect软件进行了实验研究;最终针对不同的发声对象测试了多组数据,实验结果表明所设计的语音交互系统对语音指令的识别行之有效,识别率较高。无论是裁判机还是队员机,都能快速准确地识别队员的语音指令并进行播报,完全满足人机对抗赛对人机语音交互的需求。 相似文献
16.
Abstract This paper presents a semi‐automatic phonetic labeling method for processing in the MAT (Mandarin across Taiwan) speech database. MAT speech data are collected through the telephone networks. Each utterance has been transcribed into Chinese characters and Pinyin symbols. The proposed phonetic labeling method will mark the syllable and sub‐syllable boundaries in an utterance. Phonetic symbols are assigned to each segmented syllable. The segmentation process is accomplished by using hidden Markov modeling (HMM) and Viterbi decoding. The accuracy of syllable segmentation is detected by measuring the syllable length and the distance of a syllable from its state models. The experimental results show that the proposed labeling method can achieve segmentation accuracy around 90% for an allowed tolerance of 16 ms. 相似文献
17.
18.
驾驶员语音增强质量的评价指标是保证语音增强算法性能的关键,而现有的语音增强质量评价方法不能准确地反映人对声音感知的主观性。针对上述问题,分析了言语可懂度指数对语音增强算法评价的适用性,并在某品牌汽车上进行实验。通过在汽车内建立均匀线性传声器阵列来对驾驶员语音进行信号采集,然后利用波束形成算法对阵列中不同传声器组合的语音信号进行增强,得到汽车在不同行驶速度时不同阵列组合的语音增强结果。使用信噪比和言语可懂度指数分别对实验得到的语音增强结果进行评价,结果表明言语可懂度指数更适合评价汽车内驾驶员的语音增强算法的性能。 相似文献
19.