首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 175 毫秒
1.
康峥  黄志华  赖惠成 《声学技术》2022,41(6):862-870
随着压缩感知的深入研究,压缩感知在语音增强方面的应用也备受关注。针对传统压缩感知语音增强算法中存在的不足,将压缩感知与深度学习结合构建名为基于深度压缩感知的语音增强模型(Speech Enhancement based on Deep Compressed Sensing,SEDCS)。基于压缩感知原理使用编解码模型代替压缩感知中语音信号稀疏过程,使用卷积神经网络代替测量矩阵实现语音信号观测降维过程,通过联合训练的方式实现语音增强。实验结果表明:该模型能够完成语音增强任务,并且与现有的压缩感知语音增强算法相比,该模型能取得较好的语音增强效果;相比利用深度学习的语音增强算法,该模型虽性能一般,但在模型泛化性能和测试阶段的增强时间效率上有一定提升。  相似文献   

2.
朱敏  姜芃旭  赵力 《声学技术》2021,40(5):645-651
语音情感识别是人机交互的热门研究领域之一。然而,由于缺乏对语音中时频相关信息的研究,导致情感信息挖掘深度不够。为了更好地挖掘语音中的时频相关信息,提出了一种全卷积循环神经网络模型,采用并行多输入的方式组合不同模型,同时从两个模块中提取不同功能的特征。利用全卷积神经网络(Fully Convolutional Network,FCN)学习语音谱图特征中的时频相关信息,同时,利用长短期记忆(Long Short-Term Memory,LSTM)神经网络来学习语音的帧级特征,以补充模型在FCN学习过程中缺失的时间相关信息,最后,将特征融合后使用分类器进行分类,在两个公开的情感数据集上的测试验证了所提算法的优越性。  相似文献   

3.
传统数据驱动的机械装备故障诊断方法依赖目标工况下的完备数据,而装备实际运行工况复杂多变,难以预测,且数据获取困难。针对上述问题,提出了一种深度嵌入度量网络(Deep Embedding Metric Network, DEMN)的机械跨工况故障识别方法,该方法利用装备在已知工况下的数据学习鲁棒特征表示,建立适用于未知工况场景下的泛化智能故障识别模型。基于多尺度卷积神经网络(Multiscale Convolutional Neural Network, MCNN)获取故障信号的深度嵌入特征;用度量学习方法引导判别性特征学习,构建特征嵌入空间下的三元组损失(Triplet Loss, TL);利用粒子群算法(Particle Swarm Optimization, PSO)对间隔参数进行寻优。所提方法有效缩小装备健康状态类内距离、扩大类间距离,降低工况变化对健康状态映射关系的影响。实验结果表明,该方法在齿轮箱跨工况故障诊断实验中表现出良好的识别精度与泛化性能。  相似文献   

4.
针对机械大数据因故障类内离散度和类间相似度较大而导致诊断精度低的问题,提出一种深度度量学习故障诊断方法,采用深度神经网络(Deep Neural Network, DNN)对故障特征进行自适应提取,并利用基于欧氏距离的边际Fisher分析(Marginal Fisher Analysis, MFA)方法进行了优选,在构建的深度度量网络(Deep Metric Network, DMN)顶层特征输出层添加BPNN(Back Propagation Neural Network, BPNN)分类器对网络参数进行微调,并实现故障的分类识别。通过对不同类型和严重程度的轴承故障进行了诊断分析,验证了该方法可以有效地对轴承故障进行高精度诊断,效果优于传统深度信念网络(Deep Belief Network, DBN)故障诊断方法以及常用时域统计特征结合支持向量机(Support Vector Machine, SVM)分类的故障诊断方法。  相似文献   

5.
针对小样本步态数据引起的分类器泛化能力差的问题,提出了基于支持向量机的步态分类方法.采集了24名青年和24名老年受试者的步态数据,提取24个步态特征训练支持向量机,采用交叉验证方法评估分类器的泛化性能.结果表明,本文提出的方法能够有效地对小样本步态数据分类,并且具有良好的泛化性.不同的核函数对分类性能影响较小.与传统反向传播学习算法的神经网络分类器进行了比较,支持向量机分类性能明显优于传统反向传播学习算法的神经网络.支持向量机在步态分类中具有广泛的应用前景.  相似文献   

6.
阴法明  王诗佳  赵力 《声学技术》2019,38(5):590-593
为进一步提升环境声分类的识别率,提出了一种仿深度隐藏身份特征(Deep Hidden Identity Feature,DeepID)网络连接方式的卷积神经网络——深度环境声分类网络(Deep Environment Sound Classification,DeepESC)。DeepESC网络共有六层——三层卷积层、两层全连层以及一层聚合层,为使网络在自动抽取高层次特征的同时能有效地兼顾低层次特征,网络将三层卷积层的输出聚合为一层,该层充分包含不同层次的特征,提升了卷积神经网络的特征表达能力。ESC-10和ESC-50数据集上的仿真结果表明:在相同的识别框架下,与随机森林分类器相比,本文网络识别率分别平均提升了7.6%和22.4%,与传统的卷积神经网络相比,识别率分别平均提升4%和2%,仿真实验验证了本文分类器的有效性。  相似文献   

7.
利用深度神经网络进行机械故障诊断存在复杂的调参过程,并且参数的赋值对诊断结果影响很大,为解决该问题提出一种基于深度森林的诊断模型。采用重采样技术提取了时域和频域特征;以多组简单工况下的轴承实验数据训练构建深度森林模型,在分析超参数对模型影响的基础上确定了诊断模型的关键参数;将该模型应用到复杂工况下,与随机森林模型及深度神经网络模型进行比较,实验结果表明该方法不仅有效而且具有较强的泛化能力。  相似文献   

8.
基于SVM的ECT图像重建算法   总被引:2,自引:0,他引:2  
何世钧  王化祥  周勋 《计量学报》2007,28(2):137-140
电容层析成像(ECT)技术是基于电容敏感机理的过程层析成像技术。ECT的图像重建是一个典型的有限样本非线性映射问题。支持向量机(SVM)作为一种小样本处理方法,具有较强的泛化能力,被认为是目前针对小样本分类问题的最佳理论。提出了一种基于SVM的四层神经网络的图像重建算法,仿真结果表明,该算法用于三相流图像重建具有较强的空间分辨率和泛化能力。  相似文献   

9.
基于CNN-SVM的深度卷积神经网络轴承故障识别研究   总被引:2,自引:0,他引:2  
针对传统智能诊断方法过分依赖于信号处理和专家经验提取故障特征以及模型泛化能力差的问题,基于深度学习理论,提出将卷积神经网络算法结合SVM分类器搭建适于滚动轴承故障诊断的改进型深度卷积神经网络模型。从原始实测轴承振动信号出发,模型逐层学习实现特征提取与故障识别,引入批量归一化、Dropout处理并改进模型分类器来提升轴承故障识别准确率、模型收敛速度和泛化能力。实验结果表明,优化后的深度学习模型可快速准确地提取轴承故障特征,针对不同类型、不同损伤程度的轴承可实现99%的识别准确率,并且模型有较强的泛化能力和强化学习能力。  相似文献   

10.
电机轴承的健康状态直接影响电机安全、稳定运行。针对电机轴承故障诊断问题,以故障信号可视化和特征自提取为目标,将深度置信网络(Deep Belief Network,DBN)与对称点模式(Symmetrized Dot Pattern,SDP)变换相结合,提出了一种轴承故障可视化及智能诊断方法。首先基于SDP变换将原始轴承振动信号进行可视化表示,基于最大面积函数选择最佳的SDP参数以通过高分辨率图像清晰区分不同轴承状态,并生成相应的轴承故障SDP图像库;然后采用深度置信网络作为数据训练模型以实现故障特征自提取;最后由位于DBN算法模型后的分类器实现轴承故障的有效诊断。实验结果表明,该方法不仅分类率达到98 %以上,而且具有较好的泛化能力和稳定性。该方法为电机轴承故障可视化和智能诊断提供了一种新思路。  相似文献   

11.
沈凌洁  王蔚 《声学技术》2018,37(2):167-174
提出一种基于韵律特征(基频、时长)和梅尔倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)特征的融合特征进行短语音汉语声调识别的方法,旨在利用两种特征的优势提高短语音汉语声调识别率。该融合特征包括7个根据不同模型得到的韵律特征和统计参数以及4个从每个音段的梅尔倒谱系数计算得来的对数化后验概率,使用高斯混合模型表示4个声调的倒谱特征的分布。实验分两步:第一步,将基于韵律特征和倒谱特征的分类器在决策阶段混合起来进行声调分类,分别赋予两个分类器权重,计算倒谱特征和韵律特征在声调分类任务中的权重;第二步,将基于字的韵律特征和基于帧的倒谱特征结合起来生成融合特征的超向量,使用融合特征进行汉语声调识别,根据准确率、未加权平均召回率(Unweigted Average Recall,UAR)和科恩卡帕(Cohen’s Kappa)系数3个指标,比较并评估5种分类器(两种设置的高斯混合模型,后向传播神经网络,支持向量机和卷积神经网络(Convolutional Neural Network,CNN))在不平衡数据集上的分类效果。实验结果表明:(1)倒谱特征方法能够提高汉语声调的识别率,该特征在总体分类任务中的权重为0.11;(2)基于融合特征的深度学习(CNN)方法对声调的识别率最高,为87.6%,与高斯混合模型的基线系统相比,提高了5.87%。该研究证明了倒谱特征法能够提供与韵律特征法互补的信息,从而提高短语音汉语声调识别率;同时,该方法可以运用到韵律检测和副语言信息检测等相关研究中。  相似文献   

12.
针对传统鸟声识别算法中特征提取方式单一、分类识别准确率低等问题,提出一种结合卷积神经网络和Transformer网络的鸟声识别方法。该方法综合考虑网络局部特征学习和全局上下文依赖性构造,从原始鸟声音频信号中提取短时傅里叶变换(Short Time Fourier Transform,STFT)语谱图特征,将其输入到卷积神经网络(ConvolutionalNeural Network,CNN)中提取局部频谱特征信息,同时提取鸟声信号的对数梅尔特征及一阶差分、二阶差分特征用于合成梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)混合特征向量,将其输入到Transformer网络中获取全局序列特征信息,最后融合所提取的特征可得到更丰富的鸟声特征参数,通过Softmax分类器得到鸟声识别结果。在Birdsdata和xeno-canto鸟声数据集上进行实验,平均识别准确率分别达到了97.81%和89.47%。实验结果表明该方法相较于其他现有的鸟声识别模型具有更高的识别准确率。  相似文献   

13.
Objective and quantitative assessment of skin conditions is essential for cosmeceutical studies and research on skin aging and skin regeneration. Various handcraft-based image processing methods have been proposed to evaluate skin conditions objectively, but they have unavoidable disadvantages when used to analyze skin features accurately. This study proposes a hybrid segmentation scheme consisting of Deeplab v3+ with an Inception-ResNet-v2 backbone, LightGBM, and morphological processing (MP) to overcome the shortcomings of handcraft-based approaches. First, we apply Deeplab v3+ with an Inception-ResNet-v2 backbone for pixel segmentation of skin wrinkles and cells. Then, LightGBM and MP are used to enhance the pixel segmentation quality. Finally, we determine several skin features based on the results of wrinkle and cell segmentation. Our proposed segmentation scheme achieved a mean accuracy of 0.854, mean of intersection over union of 0.749, and mean boundary F1 score of 0.852, which achieved 1.1%, 6.7%, and 14.8% improvement over the panoptic-based semantic segmentation method, respectively.  相似文献   

14.
《成像科学杂志》2013,61(8):469-475
Kernel-like impurities (KLIs) have the similar colour, shape, texture and specific gravity with sound kernels. The amount of the KLIs is an important parameter for evaluating the quality of wheat. However, it is difficult to classify KLIs from sound kernels with normal methods because of these similar features. In this study, a machine vision system with a linear colour charged coupled device used to acquire images of kernels and a software package developed to extract various features from the images were used to classify 1169 sound kernels and 896 KLIs. Three methods—genetic algorithm (GA)/support vector machine (SVM), principal components analysis/SVM and linear discriminant analysis—were applied for the classification. The performance of GA/SVM for detecting KLIs was very outstanding, and the accuracy of testing sets could reach 99.34%. GA/SVM has the potential to improve the KLI classification accuracy in machine vision system. It is feasible to extract a small quantity of useful features without any extra image or data processing for online KLI classification.  相似文献   

15.
A computer software system is designed for the segmentation and classification of benign and malignant tumor slices in brain computed tomography images. In this paper, we present a texture analysis methods to find and select the texture features of the tumor region of each slice to be segmented by support vector machine (SVM). The images considered for this study belongs to 208 benign and malignant tumor slices. The features are extracted and selected using Student's t‐test. The reduced optimal features are used to model and train the probabilistic neural network (PNN) classifier and the classification accuracy is evaluated using k fold cross validation method. The segmentation results are also compared with the experienced radiologist ground truth. Quantitative analysis between ground truth and segmented tumor is presented in terms of quantitative measure of segmentation accuracy and the overlap similarity measure of Jaccard index. The proposed system provides some newly found texture features have important contribution in segmenting and classifying benign and malignant tumor slices efficiently and accurately. The experimental results show that the proposed hybrid texture feature analysis method using Probabilistic Neural Network (PNN) based classifier is able to achieve high segmentation and classification accuracy effectiveness as measured by Jaccard index, sensitivity, and specificity.  相似文献   

16.
韩雪  慕昱  盛桂敏 《声学技术》2023,42(1):118-126
鸟类是生态系统中的重要组成部分,鸟类物种的多样性对生态环境有重要作用。所以,通过鸟声信号来识别鸟类从而对其进行保护有现实意义。文章对鸟声信号采用双参数的双门限法进行分段,从鸟声信号中寻找出声音的起始点和终止点的具体帧,进一步进行特征提取,提取每段鸟声信号中的短时能量和短时平均幅度,短时语谱图中的平均值、对比度、熵,共5种特征,采用优化参数的支持向量机进行鸟类物种分类。结果表明,基于混沌云粒子群优化(Chaos Cloud Particle Swarm Optimization, CCPSO)的支持向量机对比普通支持向量机的分类准确度得到提升,可有效地识别鸟类。利用该方法实现鸟类物种保护和生态系统管理的目的。  相似文献   

17.
基于卷积神经网络模型的遥感图像分类   总被引:2,自引:0,他引:2  
研究了遥感图像的分类,针对遥感图像的支持向量机(SVM)等浅层结构分类模型特征提取困难、分类精度不理想等问题,设计了一种卷积神经网络(CNN)模型,该模型包含输入层、卷积层、全连接层以及输出层,采用Soft Max分类器进行分类。选取2010年6月6日Landsat TM5富锦市遥感图像为数据源进行了分类实验,实验表明该模型采用多层卷积池化层能够有效地提取非线性、不变的地物特征,有利于图像分类和目标检测。针对所选取的影像,该模型分类精度达到94.57%,比支持向量机分类精度提高了5%,在遥感图像分类中具有更大的优势。  相似文献   

18.
Artificial intelligence aids for healthcare have received a great deal of attention. Approximately one million patients with gastrointestinal diseases have been diagnosed via wireless capsule endoscopy (WCE). Early diagnosis facilitates appropriate treatment and saves lives. Deep learning-based techniques have been used to identify gastrointestinal ulcers, bleeding sites, and polyps. However, small lesions may be misclassified. We developed a deep learning-based best-feature method to classify various stomach diseases evident in WCE images. Initially, we use hybrid contrast enhancement to distinguish diseased from normal regions. Then, a pretrained model is fine-tuned, and further training is done via transfer learning. Deep features are extracted from the last two layers and fused using a vector length-based approach. We improve the genetic algorithm using a fitness function and kurtosis to select optimal features that are graded by a classifier. We evaluate a database containing 24,000 WCE images of ulcers, bleeding sites, polyps, and healthy tissue. The cubic support vector machine classifier was optimal; the average accuracy was 99%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号