首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统机器学习未能考虑局部信息对新闻文本分类的影响以及无法及时捕获长距离特征信息等问题,本文提出了一种基于AI深度学习的新闻文本分类方法。为进一步验证新闻文本分类效果,该方法将径向基函数模型与多层感知层模型结合,并进行深度学习训练,通过样本标记迭代试验进行测试。结果表明,AI深度学习加快了模型训练过程,提升了模型在迭代过程的正确率,降低了漏报率,显著增强了分类效果。  相似文献   

2.
政策文本中管理规则检测是一个新兴的自然语言处理任务,在政策冲突检测、政策智能检索、事项合规性检查以及政务系统需求工程等方面具有重要应用价值。本文以矿产资源管理规则检测为研究目标,提出基于转换器的双向编码表征(BERT)提示的政策文本管理规则检测方法。该方法通过构建融入管理规则信息、带有[MASK]标记的提示模板,可以充分发挥掩码语言模型的自编码优势,有效激发BERT模型提取与管理规则相关的文本特征,增加模型稳定性;提出基于BERT模型进行管理规则检测的新应用模式,放弃使用[CLS]隐向量而采用[MASK]隐向量进行分类预测;在矿产资源管理规则数据集上的实验结果表明,该方法的准确率、宏平均F1值、加权平均F1值均优于基线方法,在公开数据集上的实验结果也表明了该方法的有效性。  相似文献   

3.
目的:针对文本分类任务,在综合考虑语义和结构信息的基础上,提出基于类语义结构的表示模型。方法:该模型先把词嵌入空间划分成不同的类子空间,在每个类子空间中选择对类别有代表性的特征词,再将特征词对应的词嵌入进行组合得到类特征向量,最后将所有的类特征向量进行级联形成文本的向量表示。结果:与其他加权词嵌入表示方法在多个数据集上进行实验比较,分类精度提高了5%~15%。结论:表明该模型在文本分类任务中具有更好的性能。  相似文献   

4.
目的 为了提升烟包缺陷检测的准确率,构建卷烟包装外观缺陷识别基准数据集,并开展主流深度学习模型在卷烟包装外观缺陷智能检测中的应用研究。方法 首先,从生产运行中的ZB45型细支烟硬盒包装机组采集缺陷图像,经过人工审核与筛选后获取典型的缺陷数据。然后,根据缺陷的特征与成因,将缺陷数据划分为23个类别,并逐一进行目标检测框标注。最终,形成了包含13 000余张缺陷图像的卷烟包装外观缺陷识别基准数据集,并针对烟包缺陷识别、缺陷分类、目标检测、模型迁移4项任务开展实验。结果 结果表明,数据集能够满足高准确率深度学习模型的训练需求;通过模型迁移,能够利用该数据集大幅提高不同牌号卷烟的缺陷检测效果;DenseNet模型在烟包缺陷识别与缺陷分类任务上表现较好,准确率分别达到93.70%和95.43%,YOLOv5模型在缺陷目标检测任务上mAP@0.5值达到了96.61%。结论 该数据集能够作为烟包缺陷检测领域的基准数据集,研究成果将进一步支撑卷烟包装领域的数据应用与数字化转型。  相似文献   

5.
针对人-机器人语音交互中经过语音识别的文本指令,提出了一种利用汉语拼音中声韵母作为特征的深度学习文本分类模型。首先,以无人驾驶车语音导航控制为人机交互的应用背景,分析其文本指令结构并分别构建单一意图与复杂意图语料库;其次,在以字符作为文本分类特征的基础上,结合汉语拼音与英文单词的区别,提出了一种利用拼音声韵母字符作为中文文本分类的特征表示方法;然后,用门控递归单元(GRU)代替传统递归神经网络单元以解决其难以捕获长时间维度特征的不足,为提取信息的高阶特征、缩短特征序列长度并加快模型收敛速度,建立了一种结合卷积神经网络及GRU递归神经网络的深度学习文本分类模型。最后,为验证模型在处理长、短序列任务上的表现,在上述两个语料库上对提出的模型分别进行十折交叉测试,并与其他分类方法进行比较与分析,结果表明该模型显著地提高了分类准确率。  相似文献   

6.
机器阅读理解(简称阅读理解)是自然语言处理领域的一项重要任务.目前基于深度学习的阅读理解模型在一些数据集上(如SQuAD)取得了很好的性能,但是这些模型不能有效整合句法结构、句子间长距离语义信息,对问题和篇章理解得不够充分.为解决以上问题提出一种新方法,该方法利用图结构对句子内部的句法结构与句子间的语义关系进行建模,然后与基于注意力机制的表示进行融合,最终形成对篇章与问题更好的理解与表示.同时,该方法还引入问题分类任务,与问答任务共同形成多任务学习框架,进一步优化了问题与文本的表示,获得了更好的答案预测准确率.相关数据集上的实验结果表明,所提方法取得了比基线模型更好的效果.  相似文献   

7.
神经网络模型结构作为深度学习的重要组成部分,在很大程度上决定着深度学习的性能表现。而目前基于深度学习的应用,大部分都由经典的网络模型修改而来。由于无法获得原神经网络模型结构,本文根据原模型的输入输出数据以及经典的神经网络模型结构,构建了原模型的预测模型。该方法主要通过对预测模型的结构参数进行编码,并利用遗传算法(GA)进行选择、交叉、变异操作,从而构建出原模型的等价模型。对于同一输入数据,等价模型和原模型的输出基本保持一致。本文提出的构建方法在图像分类、信号调制类型分类和网络链路预测领域均取得了较好的效果。  相似文献   

8.
针对传统情感分类算法存在的参数学习困难及分类性能较低等问题,提出了一种基于核超限学习机的中文文本情感分类方法.首先通过信息增益对训练数据进行特征选择以降低输入维数,然后通过构建基于小波核超限学习机的分类器实现对中文文本的情感分类.实验结果表明,新方法参数学习容易,且其文本情感分类性能通常优于支持向量机和朴素贝叶斯.  相似文献   

9.
目的 为了解决包装行业相关文本命名实体识别困难问题,提出在BiLSTM(Bidirectional Long Short-Term Memory)神经网络中加入注意力机制(Attention)和字词联合特征,构建一种基于注意力机制的BiLSTM深度学习模型(简称Attention-BiLSTM),以识别包装命名实体。方法 首先构建包装领域词典匹配包装语料中词语的类别特征,同时将包装语料转换为字特征和词特征联合的向量特征,并且在过程中加入POS(词性)信息。然后将以上特征联合馈送到BiLSTM网络,以获取文本的全局特征,并利用注意力机制获取局部特征。最后根据文本的全局特征和局部特征使用CRF(Conditional Random Field)解码整个句子的最优标注序列。结果 通过对《中国包装网》新闻数据集的实验,获得了85.6%的F值。结论 所提方法在包装命名实体识别中优于传统方法。  相似文献   

10.
情感分类是一种从文本中提取情感倾向的文本分类任务。集成学习通过结合几个分类器,在情感分类任务上能够获得比个体分类器更好的分类效果。但是,由于个体分类器在数据集上的表现不同,个体分类器在集成方法中的权重难以确定。针对集成学习中个体分类器的权重优化问题,提出一种基于差分进化优化个体分类器权重的集成分类方法,并将其应用于中文情感分类。以分类准确率为适应度值,通过差分进化算法优化5种个体分类器的权重组合,在3个领域的评论语料集上进行实验。实验结果表明,与一般的集成方法相比,该方法在中文情感分类上有更好的分类效果。  相似文献   

11.
标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的角度出发,提出了融合聚类模型和主题模型的抽取式深度神经网络中文标题生成方法和模型。在缺乏人工分类标注信息的中文新闻数据集上,该模型可利用聚类和主题模型自动挖掘数据内部潜在的特征信息,获得不同的数据簇及各簇内的主题词来辅助中文新闻标题生成,使模型在具有潜在主题类别特征的、标题质量参差的中文新闻数据集上都具有较好的适用性。本文提出的中文标题生成模型在互联网上公开的中文新闻标题数据集上的实验结果也表明其在微观F1、BLEU、ROUGE、压缩率等评价指标上都取得了较基准模型更好的效果。  相似文献   

12.
本文提出了一种基于彩色+深度(RGB-D)的人脸识别方法,以提高识别率.首先从Kinect获得一个具有丰富的头部姿势变化、光照变化等不同条件下的彩色+深度(RGB-D)图像,将获取的同一个人在不同条件下的多个图像看做一个图像集;其次将Kinect获得的原始深度数据用于姿态估计和脸区域的自动裁剪.根据估计的姿态将一组脸部图像集分成多个子图像集.对于分类,本文提出了一种基于块的协方差矩阵表示图像模型在黎曼流形上一个子图像集的方法以降维,并使用SVM模型分别学习每个子图像集,然后将所有子图像集的结果相融合得出最终的识别结果.本文所提出的方法已经在包含不同条件下超过5 000幅RGB-D图像数据集中进行了评估.实验结果表明本文算法可实现高达98.84%的识别率.  相似文献   

13.
文本数据挖掘在数字图书馆中的应用研究   总被引:2,自引:0,他引:2  
文本数据挖掘在数字图书馆中的应用进行探索研究,重点对数字图书馆文本分类的构建与实现进行研究,并将开方拟合检验方法、KNN分类算法等经典理论应用到数字图书馆文本分类模型中,以提高数字图书馆检索能力以及检索准确性。  相似文献   

14.
阐述了图像语义分割实质上是像素级别的密集分类的概念,及其在计算机视觉领域中的核心地位和应用意义。全面综述了图像语义分割算法的常用分类方法及最新成果,详尽比较了图像语义分割深度学习模型在PASCAL VOC 2012数据集上的像素准确率、平均像素正确率、平均交叠率、频率加权交叠率四个方面的实际表现性能,同时给出了模型的平均耗时、底层框架、实现语言、代码可读性、部署难度信息。最后对语义分割领域的发展进行了总结和展望,指出了模型面临的训练数据集不足、参数优化困难和结构单一的问题。  相似文献   

15.
随着计算机技术的快速发展,深度学习在工程领域的应用越来越广泛。在实际应用中,用于训练的数据集往往具有“小样本”、“高维度”、“稀疏”等特征,这导致传统深度学习模型的适用范围十分有限。该文建立了一种基于迁移学习增强的物理信息神经网络模型,用于解决数据稀疏的力学正、反问题。结合迁移学习策略,利用源模型中已有知识来加强目标任务中的学习,从而提高学习的效率,实现不需要大量数据就能得到较好预测性能的目标。该方法在薄板(两端简支+两端固支)的数据集上训练源模型,基于深度迁移学习从源模型上提取神经网络特征;利用目标任务中稀疏数据集实现源模型的微调,进而对不同边界的薄板响应预测(正问题)和边界识别(反问题)的目标任务进行验证。研究结果表明,该方法在小样本的目标任务上具有良好的精度和泛化能力。相比数据驱动的深度学习模型,物理信息神经网络模型可以有效避免数据生成带来的成本和网格独立性等问题。  相似文献   

16.
将文本挖掘理论应用于专利信息分析,提出了一种基于多分类器融合与主动学习的交互式专利分类算法,旨在实现高效的专利分类.该算法基于训练集,利用支持向量机,针对不同的专利类别分别训练相应的子分类器,然后通过多分类器融合对各子分类器进行有机结合,以获得性能更优的分类器和形成分类决策.在此基础上,利用主动学习选取最有信息的样本进行标引,从而通过人机交互实现分类模型的更新.针对传统批量选择性采样的缺点,还提出了动态批量选择性采样模式,通过确定度传播策略有效降低标引样本冗余度,以进一步提高主动学习的效率.实验结果表明,这种基于多分类器融合与主动学习的交互式专利分类算法的分类性能显著高于其他算法.  相似文献   

17.
为了提高运动想象脑机接口任务分类的准确性,需要增强运动想象脑电信号的解码精度。利用脑电的空间分布及多导联信息关联,构建图神经网络,提出了一种基于残差图卷积的运动想象任务分类模型。将残差学习嵌入深度图卷积神经网络,改善网络退化;并将分层图池化方法加入模型,充分提取运动想象脑电特征信息,提高分类准确率。该模型在两个脑机接口竞赛数据集上分别取得93.84%和96.39%的平均分类准确率以及0.917 1和0.953 5的平均Kappa系数。仿真结果表明,模型能有效提高运动想象脑机接口任务分类精度,且具有较好的泛化能力。  相似文献   

18.
针对现有基于深度学习的滚动轴承故障诊断算法训练参数量大,训练时间长且需要大量训练样本的缺点,提出了一种基于迁移学习(TL)与深度残差网络(ResNet)的快速故障诊断算法(TL-ResNet)。首先开发了一种将短时傅里叶变换(STFT)与伪彩色处理相结合的振动信号转三通道图像数据的方法;然后将在ImageNet数据集上训练的ResNet18模型作为预训练模型,通过迁移学习的方法,应用到滚动轴承故障诊断领域当中;最后对滚动轴承在不同工况下的故障诊断问题,提出了采用小样本迁移的方法进行诊断。在凯斯西储大学(CWRU)与帕德博恩大学(PU)数据集上进行了试验,TL-ResNet的诊断准确率分别为99.8%与95.2%,且在CWRU数据集上TL-ResNet的训练时间仅要1.5 s,这表明本算法优于其他的基于深度学习的故障诊断算法与经典算法,可用于实际工业环境中的快速故障诊断。  相似文献   

19.
汪荣贵  姚旭晨  杨娟  薛丽霞 《光电工程》2019,46(6):180416-1-180416-10
现有的细粒度分类模型不仅利用图像的类别标签,还使用大量人工标注的额外信息。为解决该问题,本文提出一种深度迁移学习模型,将大规模有标签细粒度数据集上学习到的图像特征有效地迁移至微型细粒度数据集中。首先,通过衔接域定量计算域间任务的关联度。然后,根据关联度选择适合目标域的迁移特征。最后,使用细粒度数据集视图类标签进行辅助学习,通过联合学习所有属性来获取更多的特征表示。实验表明,本文方法不仅可以获得较高精度,而且能够有效减少模型训练时间,同时也验证了进行域间特征迁移可以加速网络学习与优化这一结论。  相似文献   

20.
针对遥感卫星所捕获的大量不同光谱、时间和空间的遥感图像对地面物体的检测精确程度不高,该文提出了一种基于深度学习方法的SAR场景分类方法,该方法由特征提取模型、特征映射模型和分类模型3个部分组成,可以根据2个模块之间的依赖性进行建模。在RSI数据集的基础上完成试验分析,由分析结果可知,该方法在不同类型的RSI数据集上均有不同的表现,其平均准确度达到82.48%,优于对比方法。结果表明,该文方法所表现出的强大学习能力,可有效地完成像素分类和场景理解,比其他模型的遥感图像场景分类效果要好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号