排序方式: 共有35条查询结果,搜索用时 31 毫秒
21.
针对作者已经提出的双因子高斯过程隐变量模型(Two-factor Gaussian process latent variable model,TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model,HMM)对语音动态特征进行建模,并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡. 相似文献
22.
迷彩伪装目标与周围环境高度相似,对迷彩伪装目标的检测任务比普通的检测任务更具挑战性,常规的检测算法对迷彩伪装目标检测任务不完全适用.文中对现有方法进行分析,以YOLO v5算法为基础,提出了一种针对迷彩伪装目标的检测算法.该算法结合注意力机制设计了新的特征提取网络,突出了迷彩伪装目标的特征信息;并且对原有的聚合网络进行了改进,增大了检测的尺度,使用非对称卷积模块强化了目标语义信息.在一种公开的迷彩伪装目标数据集上将该算法与7种算法进行对比,所提算法的mAP值较原始算法提升了4.4%,召回率提升了2.8%,在mAP值方面也比其他算法更具优势,从而验证了所提算法对迷彩伪装目标检测任务的有效性. 相似文献
23.
提出了一种结合Mellin变换和Mel频率分析的语音信号特征--MMCC特征.该特征利用Mellin变换的尺度不变性质,抑制了特征参数受不同说话人声道变化的影响,同时结合Mel频率的人耳听觉特性,改善了特征的鲁棒性,适合于非特定人识别系统的应用.仿真结果表明,采用MMCC特征的非特定人语音识别系统,其识别效果优于采用LPCC特征、MFCC特征和MMTLS特征的非特定人语音识别系统. 相似文献
24.
25.
26.
27.
利用循环平稳特性对通信信号进行参数估计是一种常用的处理方法。由于通信信号在循环频率域具有稀疏特性,可以利用随机测量有效降低采样处理的数据量,减轻硬件负荷,并基于压缩采样值进行信号参数估计。然而,在稀疏建模时通常将连续的信号参数空间划分为有限数量的均匀网格,引起基不匹配问题,使得信号在某个假定的离散变换基(傅里叶基、小波基等)下并不稀疏,从而严重影响信号参数估计精确度。为解决这个问题,本文利用原子范数描述循环频率域的连续性和稀疏性,提出一种随机测量条件下的高精确度循环自相关函数无网格估计方法。仿真实验表明,这种无网格估计方法能够有效降低循环自相关函数的估计误差。 相似文献
28.
29.
30.
针对现有基于字典学习的增强算法依赖先验信息的问题,基于矩阵的稀疏低秩分解提出一种无监督的单通道语音增强算法。该算法首先通过稀疏低秩分解将带噪语音的幅度谱分解为低秩、稀疏和噪声三部分,然后通过对低秩部分进行自学习构建出噪声字典,最后利用所得噪声字典和乘性迭代准则于低秩和稀疏部分中分离出纯净语音。相较于其他基于字典学习的语音增强算法,本文所提算法无需语音或噪声的先验信息,因而更加方便和实用。实验结果显示,本文算法能够在保留语音谐波结构的同时有效抑制噪声,增强效果明显优于鲁棒主成分分析和多带谱减法。 相似文献