首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 280 毫秒
1.
为实现碳钢石墨化的智能化评级,基于卷积神经网络与迁移学习的方法构建了碳钢金相图像的自动分类模型;首先通过几何变换和像素调整的数据增强方法建立了碳钢石墨化图像数据集;然后采用统一扩展网络宽度、深度和分辨率方式来协调精度与效率的轻量级EfficientNet网络作为主干特征提取网络,构建碳钢石墨化图像评级模型,并在训练阶段利用迁移学习与参数微调的方法来提高模型的训练效率;最后使用测试数据集对模型的分类精度与复杂度进行了验证实验,结果表明该模型能快速准确地对碳钢石墨化程度进行自动评级,在仅需12 MB内存的情况下,便可实现97.01%的评级准确率,单幅金相图像的平均检测时间也仅需10.27 ms,满足现场检测的精度与实时性要求。  相似文献   

2.
对切换回归模型的聚类方法一般都没有考虑到噪音的影响,因此在含有噪音数据的情况下,用这些方法聚类的结果就会出现一定的偏差.为了减弱聚类过程中噪音数据的影响,提出了一种新的具有抵抗噪音能力的聚类算法,称为抗噪音聚类算法.该算法通过将已知数据集划分为非噪音数据集和噪音数据集2个子集,然后对非噪音数据集进行聚类分析,估计出模型的各个参数.通过对噪音数据集和非噪音数据集进行不断地调整,同时不断地修正得到的参数估计值,从而得到对聚类结果的优化.实验表明,抗噪音聚类算法能够有效地克服噪音数据对聚类结果的影响,并估计出优质的参数.  相似文献   

3.
为促进矿业领域向信息化、智能化的方向转变,实现对石墨的智能识别尤为关键.针对人工识别石墨花费时间长、效率低等问题,提出了一种改进的AlexNet网络应用于石墨的图像识别.首先通过随机裁剪、依概率水平翻转和归一化处理等手段对数据集进行图像预处理达到数据增强的目的;然后采用激活函数ReLU6压缩动态范围,使算法更稳健;运用...  相似文献   

4.
我国股市波动受投资者情绪变化影响较大,通过对股吧等金融交流平台上投资者的评论进行情感分析,能够帮助投资者更好地了解股票市场的变化.现有的情感分析方法是利用模型对股票评论集进行分析,但缺少优质的股票评论标注数据集用于模型训练,且单一模型提取股票评论特征较为片面,模型的准确性有待提高.该文针对股吧平台上的评论数据,提出一种...  相似文献   

5.
在机器学习和数据库等领域,高质量数据集的合成一直以来是一个非常重要且充满挑战性的问题.其中,合成的高质量数据集可用来改善模型,尤其是深度学习模型的训练过程.一个健壮的模型训练过程需要大量已标注的数据集,获取这些数据集的一种方法是通过领域专家的手动标注,这种方法不仅代价大还容易出错,因此由模型自动合成高质量数据集的方法更为合理.近年来,由于计算机视觉领域的飞速发展,已经有不少致力于图像数据集合成的研究,但是这些模型不能直接应用在结构化数据表上,并且据调研,对这类数据的相关研究几乎没有.因此,提出了一个针对结构化数据表的生成模型TableGAN,该模型是生成式对抗网络(generative adversarial network, GAN)家族的一种变体,通过对抗训练的方式提高生成模型的性能.针对结构化数据的特征改变了传统GAN模型的内部结构,包括优化函数等,使其能够生成高质量的结构化数据用于改善模型的训练过程.通过在真实数据集上的大量实验表明了此模型的有效性,即在扩大后的数据集上训练模型的效果有明显提升.  相似文献   

6.
开源数据集加速了深度学习的发展, 但存在许多不合理使用数据集的现象. 为保护数据集的知识产权, 近期工作提出数据集水印算法, 在数据集发布前预先植入水印, 当模型在此数据集上训练时该水印会被附着在模型中, 之后通过验证可疑模型是否存在水印来追溯数据集的非法使用. 但已有数据集水印算法无法在小扰动下提供有效并且隐蔽的黑盒水印验证. 为解决这一问题, 本文首次提出利用独立于图像内容与标签的风格属性来植入水印, 并限制对原数据集的扰动不涉及标签的修改. 通过不引入图像内容与标签的不一致性和额外的代理模型保证水印隐蔽性和有效性. 在水印验证阶段仅使用可疑模型的预测结果通过假设检验给出判断. 本文在CIFAR-10数据集上与现有5种方法相比较, 实验结果验证了本文提出的基于风格的数据集水印算法的有效性与功能不变性. 此外, 本文开展的消融实验验证了本文所提的风格优化模块的必要性, 算法在不同超参设定以及不同数据集下的有效性.  相似文献   

7.
乳腺癌是女性中最常见的癌症,乳腺肿块识别模型能有效地辅助医生的临床诊断工作.然而,医学图像样本稀缺使识别模型易过拟合.提出融入深层病理信息挖掘的乳腺肿块识别模型:构建样本精选策略,跨越不同乳腺造影图像数据集筛选优质样本,从数据增强角度应对医学图像样本稀缺;由浅入深挖掘有限标注样本中蕴含的病理信息,从特征优选角度应对医学...  相似文献   

8.
一种软件可靠性增长模型选择与综合方法   总被引:1,自引:0,他引:1  
软件可靠性增长模型可以预测软件在将来某个时刻的可靠性,以此作为软件是否发布的依据.而目前常见的各种模型对不同失效数据集的预测能力并不一致.提出了一种软件可靠性增长模型选择和应用的框架,利用可靠性模型评价准则,对特定的失效数据集选择优选模型集,根据优选模型集利用神经网络较好的学习预测能力计算可靠性.利用此方法对实际软件项目中的失效数据进行了分析,并验证了它的有效性.  相似文献   

9.
近来,大模型已成为人工智能产业的焦点所在,Al三驾马车之一的数据集重要性凸显.本研究收集了国内大模型数据集的相关信息,总结发现当前国内大模型数据集主要来源包括公开、自有、合作、采购;目前数据集存在公开数据量不足、数据管理分散、数据私域化问题.针对相关问题,建议电信运营商培养输出高质量数据集能力,并加强产业合作,打造数据开源环境.  相似文献   

10.
采用一个组织良好的数据集和基于深度学习的模型,实现根据上下文获得论文的引文推荐.模型包括一个文档编码器和一个上下文编码器,使用图卷积网络层(GCN)和预训练模型BERT[1]的双向编码器表示.通过修改相关的PeerRead数据集,建立一个PeerReadPlus新数据集,它包含引用文献的上下文语句和论文元数据.结果表明...  相似文献   

11.
卜令正  王洪栋  朱美强  代伟 《计算机应用》2018,38(12):3403-3408
现有的数字识别算法多是对单一类型数字进行识别,无法应对识别多源数字。针对包含手写体数字与数码管数字的字符识别场景,提出一种基于改进卷积神经网络(CNN)的多源数字识别算法。首先,使用从数显仪表生产企业现场采集的样本,结合MINIST数据集,建立起包含手写体和数码管的混合数据集;然后,考虑更好的鲁棒性,提出一种改进的CNN,并用上述混合数据集对其训练,实现了一个网络识别多类型数字;最后,训练好的神经网络模型被成功应用于RoboMaster机甲大赛的多源数字识别场景中。测试结果表明,所提算法整体识别准确率稳定且较高,具有较好的鲁棒性和泛化能力。  相似文献   

12.
针对纹身图像的特点和卷积神经网络(CNN)在全连接层对图像特征抽取能力的不足问题,提出一种三通道的卷积神经网络纹身图像检测算法,并进行了三方面的改进工作。首先,针对纹身图像的特点改进图像预处理方案;其次,设计了一个基于三通道全连接层的卷积神经网络进行特征提取,并对特征建立索引,有效地提高了网络对不同尺度下空间信息的提取能力,实现了对纹身图像的高效检测;最后,通过两个数据集验证了算法的泛化能力。实验结果表明,对NIST数据集所提预处理方案比Alex方案有总正确率提高0.17个百分点,纹身图像正确率提高0.29个百分点。在所提预处理方案下,提出的算法在标准的NIST纹身图像集上具有明显的优势,正确率从NIST公布的最优值96.3%提高到99.1%,提高了2.8个百分点;相对于传统的CNN算法,正确率从98.8%提高到99.1%,提高了0.3个百分点。在Flickr数据集上也有相应的性能提升。  相似文献   

13.
结合改进主动学习的SVD-CNN弹幕文本分类算法   总被引:1,自引:0,他引:1  
为解决传统卷积神经网络(CNN)模型使用池化层进行文本特征降维会损失较多文本语义信息的问题,提出一种基于奇异值分解(SVD)算法的卷积神经网络模型(SVD-CNN)。首先,采用改进的基于密度中心点采样的主动学习算法(DBC-AL)选择对分类模型贡献率较高的样本进行标注,以低标注代价获得高质量模型训练集;然后,结合SVD算法建立SVD-CNN弹幕文本分类模型,使用奇异值分解的方法代替传统CNN模型池化层进行特征提取和降维,并在此基础上完成弹幕文本分类任务;最后,使用改进的梯度下降算法(PSGD)对模型参数进行优化。为了验证改进算法的有效性,使用多种弹幕数据样本集,对提出的模型与常用的文本分类模型进行对比实验。实验结果表明,改进的算法能够更好地保留文本语义特征,保证训练过程的稳定性并提高了模型的收敛速度,在不同的弹幕文本上较传统算法具有更好的分类性能。  相似文献   

14.
文本情绪分类是自然语言处理领域的一个基本任务。然而,基于不平衡数据的学习使得传统文本情绪分类方法的分类性能降低。针对这个问题,该文提出了一种融合CNN和EWC算法的不平衡文本情绪分类方法。首先,该方法使用随机欠采样方法得到多组平衡数据;其次,按顺序单独使用每一组平衡数据输入CNN训练,同时在训练过程中引入EWC算法用以克服CNN中的灾难性遗忘;最后,把使用最后一组平衡数据输入CNN训练得到的模型作为最终分类模型。实验结果表明,该方法在分类性能上明显优于基于欠采样和多分类算法的集成学习框架,且该方法比基于多通道LSTM神经网络的不平衡情绪分类方法在Accuracy和G-mean上分别提高了1.9%和2.1%。  相似文献   

15.
In a competitive electricity market, the forecasting of energy prices is an important activity for all the market participants either for developing bidding strategies or for making investment decisions. In this paper, a new forecast strategy is proposed for day ahead prediction of electricity price, which is a complex signal with nonlinear, volatile and time dependent behavior. Our forecast strategy includes a new two stage feature selection algorithm, a composite neural network (CNN) and a few auxiliary predictors. The feature selection algorithm has two filtering stages to remove irrelevant and redundant candidate inputs, respectively. This algorithm is based on mutual information (MI) criterion and selects the input variables of the CNN among a large set of candidate inputs. The CNN is composed of a few neural networks (NN) with a new data flow among its building blocks. The CNN is the forecast engine of the proposed strategy. A kind of cross-validation technique is also presented to fine-tune the adjustable parameters of the feature selection algorithm and CNN. Moreover, the proposed price forecast strategy is equipped with a few auxiliary predictors to enrich the candidate set of inputs of the forecast engine. The whole proposed strategy is examined on the PJM, Spanish and Californian electricity markets and compared with some of the most recent price forecast methods.  相似文献   

16.
针对图像识别算法中图像集上几何曲面的特定分类会导致判别信息丢失的问题,提出一种融合卷积神经网络的改进型迭代深度学习算法(IIDLA)。该算法采用混合卷积网(PCL)进行底层的平移不变特征学习,以层次化的方式迭代应用卷积神经网络(CNN)对输入图像集的不同非线性特征进行学习。算法的图库和查询实例中包括了不同视角、背景、面部表情、解析度和照明度的人脸或物体图像集。采用数据集将提出的算法与其他算法进行评估对比,实验结果表明,提出的算法在被测数据集上的性能最优。  相似文献   

17.
任志玲  南忠明 《控制工程》2022,29(2):263-270
针对串联型故障电弧影响供电系统安全且不易测量的问题,提出改进卷积神经网络对串联型故障电弧的识别方法.由于SVM学习的超平面是距离各个样本最远的平面,相比于Softmax,具有更强的泛化推广能力和更高的识别准确率,故采用SVM损失函数(hinge loss)替换原有的Softmax损失函数并在CNN模型中添加三层Ince...  相似文献   

18.
基于递归神经网络的序列到序列的模型在文本摘要生成任务中取得了非常好的效果,但这类模型大多存在生成文本重复、曝光偏差等问题。针对重复问题,提出一种由存储注意力和解码自注意力构成的混合注意力,通过存储历史注意力和增加对历史生成单词的注意力来克服该问题;使用强化学习作为一种新的训练方式来解决曝光偏差问题,同时修正损失函数。在CNN/Daily Mail数据集对模型进行测试,以ROUGE为评价指标,结果证明了混合注意力对重复问题有较大的改善,借助强化学习可以消除曝光偏差,整合后的模型在测试集上超越先进算法。  相似文献   

19.
近邻(Nearest Neighbor,NN)算法是一种简单实用的监督分类算法。但NN算法在分类未知类标的样例时,需要存储整个训练集,还要计算该样例到训练集中每一个样例之间的距离,所以NN算法的计算复杂度非常高。为了克服这一缺点,P.Hart提出了压缩近邻(Condensed Nearest Neighbor,CNN)规则算法,即从整个训练集中找原样例集的一致子集(一致子集是能正确分类训练集中其他样例的子集)。其计算复杂度依然比较高,特别是对于大型数据库,寻找其一致子集是非常耗费时间的。针对这一问题,提出了基于粗糙集技术的压缩近邻规则算法。该算法分为3步,首先利用粗糙集方法求属性约简(特征选择),以将冗余的属性去掉。然后选取靠近边界域的样例,以将冗余的样例去掉。最后从选出的样例中计算一致子集。该算法能同时沿垂直方向和水平方法进行数据约简。实验结果显示,所提出的方法是行之有效的。  相似文献   

20.
针对行人重识别研究中训练样本的不足,为提高识别精度及泛化能力,提出一种基于卷积神经网络的改进行人重识别方法。首先对训练数据集进行扩充,使用生成对抗网络无监督学习方法生成无标签图像;然后与原数据集联合作半监督卷积神经网络训练,通过构建一个Siamese网络,结合分类模型和验证模型的特点进行训练;最后加入无标签图像类别分布方法,计算交叉熵损失来进行相似度量。实验结果表明,在Market-1501、CUHK03和DukeMTMC-reID数据集上,该方法相比原有的Siamese方法在Rank-1和mAP等性能指标上有近3~5个百分点的提升。当样本较少时,该方法具有一定应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号