期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王尔馥张乃通孟维晓蔺兴海《计算机工程与应用》2009,45(23):134-136

频域盲源分离方法通过STFT变换将时域的线性卷积模型转化为频域的瞬时混合模型,可以利用瞬时混合的成熟算法,然而缺点是存在排列和尺度的不确定性,会使逆STFT变换后的信号发生再次混叠。对分离矩阵内部结构进行研究,提出邻频幅角比的概念,通过纠正图样中发生排列错误频点处的分离矩阵结构,达到正确拟合已分离信号的目的。仿真结果表明,邻频幅角比排序算法可以纠正大多数频点上的排序错误,正确进行盲源分离。相似文献

2.

改进频点权重系数的频域盲源分离排序算法

陈超何怡刚尹柏强方葛丰樊晓腾佘开《计算机应用研究》2014,31(12)

为解决卷积混合频域盲源分离排序不确定问题,研究了分离矩阵行列式变化和频点距离对基于相邻频点幅度相关性排序算法的影响,提出了改进的盲源分离排序算法.改进算法用权重系数来衡量频点对排序的影响,并将分离矩阵作为下一频点分离矩阵的迭代初值,给出了权重系数设定函数.最后对瞬时混合信号、卷积混合信号、实际房间采集信号分别进行盲源分离实验.实验结果表明,与Murata算法相比,改进算法分离信号信噪比提高、分离速度加快、算法鲁棒性强. 相似文献

3.

基于改进时频比的语音音乐信号分离

郭伟于凤芹《计算机工程》2015,(3):287-291

时频比是混合信号在时频域幅值特性的比值,利用时频比寻找混合信号中的单源点,对相应的比值构成的矩阵求逆可以得到对源信号的估计。针对基于时频比的盲源分离将信号变换到时频域后计算量大且对算法有效的时频窗较少的问题,提出用重复结构周期内的时频点代替整个时频域进行单源点的检测,重复结构内的时频点在每个周期内都有相似的值,通过减少一个周期内时频点的检测,由单源点对应的时频比恢复出源信号。用相似系数矩阵评价分离效果,仿真实验结果表明,在达到几乎相同的相似系数的情况下,运行时间可减少45.43%,可有效降低运算量。相似文献

4.

卷积混合盲源分离中1种改进的排序模糊消除算法

文威张杭《系统仿真技术》2011,7(4):318-323

频域方法可以有效地解决卷积混合盲源分离问题.针对频域方法中存在排序模糊,基于分离信号相邻频点功率谱密度的相关性较高的原理,提出1种改进的排序模糊消除算法.相比于原算法,扩展了参考频点的取值范围,同时还采用了1种置信度量方法,能够获得更准确的排序估计.仿真实验表明所提算法有效地消除了排序模糊,并且能够纠正某一频点排序的突... 相似文献

5.

基于Hilbert-Huang变换的语音信号分离 总被引：1，自引：0，他引：1

张朝柱张健沛孙晓东《计算机应用》2009,29(1):227-229,

针对短时傅里叶变换不能正确得到非平稳信号的能量频率分布问题,提出了一种基于Hilbert-Huang变换的单信道语音信号分离的算法。该算法首先对分解得到的各内蕴模式函数分量(IMF)进行Hilbert变换,得到混合信号时频面上的Hilbert谱,然后对混合信号的Hilbert谱运用独立子空间分析的方法得出代表各个独立源信号的子空间,并对其求逆变换,从而恢复出各个源信号。通过仿真实验验证了此算法的正确性和有效性,且与短时傅里叶变换时频分析法相比较,其分离性能明显得到改善,显示了Hilbert-Huang变换在处理非平稳信号的优越性。相似文献

6.

频域盲解卷积局限性分析及一种改进算法

张超 ;吴小培《微机发展》2008,(10):57-60

在频域盲解卷积问题中,时域信号的卷积混合转化为频域信号在有限频点的瞬时混合,使算法复杂度大大降低。但这种算法的局限是分离结果存在次序和幅度上的不确定性,并且窗函数长度和信号非平稳性之间存在相互制约的关系。文中对语音信号频域盲解卷积算法存在的制约因素进行分析并提出一种改进的基于包络相关性的排序方法。在分裂谱法的基础上,通过“分裂”后的多路信号求得“总包络”,再依据“总包络”进行排序,从而克服传统的直接依据输出信号包络相关性进行排序的不足。实验结果表明,采用本方法可获得较高的分离质量。相似文献

7.

频域盲解卷积局限性分析及一种改进算法 总被引：1，自引：0，他引：1

张超吴小培《计算机技术与发展》2008,18(10)

在频域盲解卷积问题中,时域信号的卷积混合转化为频域信号在有限频点的瞬时混合,使算法复杂度大大降低.但这种算法的局限是分离结果存在次序和幅度上的不确定性,并且窗函数长度和信号非平稳性之间存在相互制约的关系.文中对语音信号频域盲解卷积算法存在的制约因素进行分析并提出一种改进的基于包络相关性的排序方法.在分裂谱法的基础上,通过"分裂"后的多路信号求得"总包络",再依据"总包络"进行排序,从而克服传统的直接依据输出信号包络相关性进行排序的不足.实验结果表明,采用本方法可获得较高的分离质量. 相似文献

8.

解卷积混合语音频域盲分离的次序问题新方法 总被引：1，自引：0，他引：1

吴文妍张立明《数据采集与处理》2008,23(6)

多通道语音信号的混合往往是卷积混合,瞬时盲分离方法不能获得好的分离效果,而频域方法由于频率次序的问题使性能下降.本文采用时频掩模的方法得到各频点上具有确定次序的、但带有失真的分离信号,将其作为参考,与频域上解得的次序不定信号进行相关,从而获得精确的语音分离信号.实验表明:本文提出的方法能有效地解决频域盲分离的次序不确定性问题,得到精度更高的分离卷积混舍的语音信号. 相似文献

9.

一个用于卷积混合模型的时频分析盲分离算法

王卫华黄凤岗《数据采集与处理》2009,24(1)

提出一种基于时频分析的卷积混合盲分离算法.由于信号源与各传感器的距离不同,在传播的过程中会产生不同的幅度衰减和时间延迟.该算法用短时傅里叶变换对语音信号进行时频分析,将其中一个传感器信号作为参考信号,构造了源信号的幅度衰减向量和时间延迟向量.根据语音信号的时频域稀疏性,以这两个向量为特征,在时频域上对传感器信号进行聚类,再通过估计参考信号混合系数来获得源信号时频域表示,进一步得到源信号.该方法可以用于源信号数目大于传感器信号数目的情况.仿真实验证明,算法可以完成欠定情况下卷积混合信号的盲分离,分离结果令人满意. 相似文献

10.

六角形阵快速傅立叶变换波束形成算法

潘翔周斌李建龙宫先仪《传感技术学报》2007,20(5):1086-1089

在六角形阵阵元数较多时,传统的频域相移求和波束形成方法要求的运算量很大.为此提出一种采用六角形快速傅立叶变换HFFT(Hexagonal Fast Fourier Transform)的波束形成算法.使用六角形傅立叶变换HDFT(Hexagonal Discrete Fourier Transform)完成六角形阵的波束形成,由于HDFT存在快速算法HFFT,因此能够显著降低波束形成的运算量.首先在各个通道上做FFT,将信号变换到频域,然后转角重排,再对各个阵元上相同的频点做HFFT,得到频域常规波束形成输出.理论分析表明,对于窄带信号的六角形阵波束形成,所提出的算法所需的计算量比传统的相移求和方法降低了95%以上.仿真和试验结果表明,提出的算法在不影响阵列处理性能的同时,显著降低了波束形成所需的计算量,易于工程实现. 相似文献

11.

多频带频域深度置信网络脑电特征识别算法

蔡军胡洋揆张毅尹春林《机器人》2018,40(4):510-517

针对DBN（深度置信网络）脑电信号识别率不高的问题,提出了多频带频域深度置信网络（multi-band FDBN）算法进行特征提取.不同频带存在个体性差异,它们对于分类结果的贡献不完全相同,本文利用带通滤波器将原始的脑电信号分成多个频段,再采用FFT（快速傅里叶变换）将时域信号转换为频域信号并作归一化处理,最后将每个频段的频域数据输入DBN进行训练识别.线下实验证明,相比FDBN（频域深度置信网络）算法,多频带FDBN的平均准确率提高了3.25%,且标准差更小,鲁棒性更好.最后,在智能轮椅平台上,利用多频带FDBN算法基于左右手运动想象脑电信号控制轮椅完成了"8"字形路径,证明了该算法在脑电信号特征提取中的有效性. 相似文献

12.

Mixing Audiovisual Speech Processing and Blind Source Separation for the Extraction of Speech Signals From Convolutive Mixtures

《IEEE transactions on audio, speech, and language processing》2007,15(1):96-108

Looking at the speaker's face can be useful to better hear a speech signal in noisy environment and extract it from competing sources before identification. This suggests that the visual signals of speech (movements of visible articulators) could be used in speech enhancement or extraction systems. In this paper, we present a novel algorithm plugging audiovisual coherence of speech signals, estimated by statistical tools, on audio blind source separation (BSS) techniques. This algorithm is applied to the difficult and realistic case of convolutive mixtures. The algorithm mainly works in the frequency (transform) domain, where the convolutive mixture becomes an additive mixture for each frequency channel. Frequency by frequency separation is made by an audio BSS algorithm. The audio and visual informations are modeled by a newly proposed statistical model. This model is then used to solve the standard source permutation and scale factor ambiguities encountered for each frequency after the audio blind separation stage. The proposed method is shown to be efficient in the case of 2 times 2 convolutive mixtures and offers promising perspectives for extracting a particular speech source of interest from complex mixtures 相似文献

13.

On the Assumption of Spherical Symmetry and Sparseness for the Frequency-Domain Speech Model

Intae Lee Te-Won Lee 《IEEE transactions on audio, speech, and language processing》2007,15(5):1521-1528

A new independent component analysis (ICA) formulation called independent vector analysis (IVA) was proposed in order to solve the permutation problem in convolutive blind source separation (BSS). Instead of running ICA in each frequency bin separately and correcting the disorder with an additional algorithmic scheme afterwards, IVA exploited the dependency among the frequency components of a source and dealt with them as a multivariate source by modeling it with sparse and spherically, or radially, symmetric joint probability density functions (pdfs). In this paper, we compare the speech separation performances of IVA by using a group of l^p-norm-invariant sparse pdfs where the value of and the sparseness can be controlled. Also, we derive an IVA algorithm from a nonparametric perspective with the constraint of spherical symmetry and high dimensionality. Simulation results confirm the efficiency of assuming sparseness and spherical symmetry for the speech model in the frequency domain. 相似文献

14.

基于深度自编码器子域自适应的跨库语音情感识别

庄志豪傅洪亮陶华伟杨静谢跃赵力《计算机应用研究》2021,38(11):3279-3282,3348

针对不同语料库之间数据分布差异问题,提出一种基于深度自编码器子域自适应的跨库语音情感识别算法.首先,该算法采用两个深度自编码器分别获取源域和目标域表征性强的低维情感特征;然后,利用基于LMMD(local maximum mean discrepancy)的子域自适应模块,实现源域和目标域在不同低维情感类别空间中的特征分布对齐;最后,使用带标签的源域数据进行有监督地训练该模型.在eNTERFACE库为源域、Berlin库为目标域的跨库识别方案中,所提算法的跨库识别准确率相比于其他算法提升了5.26％～19.73％;在Berlin库为源域、eNTERFACE库为目标域的跨库识别方案中,所提算法的跨库识别准确率相比于其他算法提升了7.34％～8.18％.因此,所提方法可以有效地提取不同语料库的共有情感特征并提升了跨库语音情感识别的性能. 相似文献

15.

拉普拉斯分布下的MMSE谱减语音增强算法

王永彪张文喜王亚慧孔新新吕彤《计算机应用》2020,40(3):878-882

针对基于高斯分布的谱减语音增强算法,增强语音出现噪声残留和语音失真的问题,提出了基于拉普拉斯分布的最小均方误差（MMSE）谱减算法。首先,对原始带噪语音信号进行分帧、加窗处理,并对处理后每帧的信号进行傅里叶变换,得到短时语音的离散傅里叶变换（DFT）系数;然后,通过计算每一帧的对数谱能量及谱平坦度,进行噪声帧检测,更新噪声估计;其次,基于语音DFT系数服从拉普拉斯分布的假设,在最小均方误差准则下,求解最佳谱减系数,使用该系数进行谱减,得到增强信号谱;最后,对增强信号谱进行傅里叶逆变换、组帧,得到增强语音。实验结果表明,使用所提算法增强的语音信噪比（SNR）平均提高了4.3 dB,与过减法相比,有2 dB的提升;在语音质量感知评估（PESQ）得分方面,与过减法相比,所提算法平均得分有10%的提高。该算法有更好的噪声抑制能力和较小的语音失真,在SNR和PESQ评价标准上有较大提升。相似文献

16.

一种基于结构化学习的排序算法

下载免费PDF全文

程凡仲红李龙澍张以文《计算机工程与应用》2011,47(12):16-19

传统排序算法将排序问题转换成分类或回归问题来求解,这样得到的模型不够精确。对此提出一种新的排序算法,该算法把排序问题看成一个结构化学习过程,即通过训练集来学习一个排序结构。算法首先定义了一个查询级的目标函数,针对算法约束条件太多,难以直接优化,提出使用割平面算法进行求解。对于算法中的“寻找最违约排列”子问题,将其变换成为一个简单的降序排列问题。基于基准数据集的实验表明,相比起传统的排序算法,所提算法更为有效。相似文献

17.

多通道皮肤听声系统中语音增强算法的应用研究

宫洵李建文王马川《计算机工程与科学》2011,33(4):164

针对提高应用多通道皮肤听声系统进行语音识别的识别率,提出了基于多频带谱减法的语音增强算法。在多通道皮肤听声的实验中,有色噪声会严重降低语音质量,进而降低皮肤听声系统语音识别的识别率,因而首次将基于多带谱减法的语音增强算法引入到皮肤听声系统中以降低有色噪声。多频带谱减法将语音频带划分为多个子频带,分别在每个子频带作不同系数的谱减运算实现语音增强。通过Matlab完成了算法仿真并通过DSP硬件实现了算法并将增强后的语音信号输出给皮肤听声系统,实验证明此设计能够有效抑制有色噪声,增强皮肤听声系统的可靠性和实用性。相似文献

18.

基于双微阵列与卷积神经网络的语音识别方法

刘伟波曾庆宁卜玉婷郑展恒《计算机应用》2019,39(11):3268-3273

为解决噪声环境下语音识别率降低以及传统波束形成算法难以处理空间噪声的问题,基于双微阵列结构提出了一种改进的最小方差无畸变响应（MVDR）波束形成方法。首先,采用对角加载提高双微阵列增益,并利用递归矩阵求逆降低计算复杂度;然后,通过后置调制域谱减法对语音作进一步处理,解决了一般谱减法容易产生音乐噪声的问题,有效减小了语音畸变,获得了良好的噪声抑制效果;最后,采用卷积神经网络（CNN）进行语音模型的训练,提取语音深层次的特征,有效地解决了语音信号多样性问题。实验结果表明,提出的方法在经CNN训练的语音识别系统模型中取得了较好的识别效果,在信噪比为10 dB的F16噪声环境下的语音识别率达到了92.3%,具有良好的稳健性。相似文献

19.

基于子带可控响应功率的多声源定位方法

倪志莲蔡卫平张怡典《计算机工程与应用》2013,49(24):205-209

为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语音信号频率的稀疏性,这些初始估计包含多个声源的位置,运用会聚聚类算法得到最终的声源位置估计。仿真和实验表明,在有2个说话人,10 dB信噪比,较强混响的条件下,该算法比传统算法的定位正确率提高了约4%,额外率降低了约7%。相似文献

20.

A minimum variance distortionless response filter based on the bifrequency spectrum for single-channel noise reduction

《Digital Signal Processing》2014

This paper deals with the problem of single-channel noise reduction in the short-time Fourier transform (STFT) domain. Many algorithms have been developed to solve this important problem, most of which generally assume that the STFT coefficients in different frequency bands are uncorrelated, so the noise reduction is achieved by applying a gain function to the STFT of the noisy speech in each frequency band. However, this assumption is not accurate and the STFT coefficients of speech signals between neighboring frequency bands are correlated in practice due to the use of small lengths of the fast Fourier transform (FFT) and overlap add/save techniques in implementation. This paper formulates the noise reduction problem by taking into account the interband correlation using the so-called bifrequency spectrum. Based on this formulation, a single-channel minimum variance distortionless response (MVDR) filter is derived, which is shown to be able to significantly improve the signal-to-noise ratio (SNR) and meanwhile maintain the desired speech not much distorted. Simulations are presented to justify the claimed merits of the developed MVDR filter. 相似文献