期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘清清周志勇范国华钱旭升胡冀苏陈光强戴亚康《浙江大学学报(工学版)》2021,55(11):2033-2044

针对分割神经网络需要大量的高质量标签但较难获取的问题,提出基于3D scSE-UNet的半监督学习分割方法. 该方法使用自训练的半监督学习框架,将包含改进的并行空间/特征通道压缩和激励模块（scSE-block+）的3D scSE-UNet作为分割网络. scSE-block+可以从图像空间和特征通道2个方面自动学习图像的有效特征,抑制无用冗余特征,更好地保留图像边缘信息. 在自训练过程中加入全连接条件随机场,对分割网络产生的伪标签进行边缘细化,提升伪标签的精确度. 在LiTS17 Challenge和SLIVER07数据集上验证所提出方法的有效性. 当有标签图像占训练集总图像的30%时,所提方法的Dice相似系数(dice score)为0.941. 结果表明,所提出的半监督学习分割方法可以在仅使用少量标注数据的情况下,取得与全监督分割方法相当的分割效果,有效减轻肝脏CT图像分割对专家标注数据的依赖. 相似文献

2.

融合Stacking 和深度学习的中文产品评论情感分析

下载免费PDF全文

方红蒋广杰李德生沙雷雨馨《上海第二工业大学学报》2023,40(3):245-253

大量涌现的电商产品评论对企业制定商业决策十分有利, BERT 应用在英语文本情感分析中取得了不错的效果。针对中文电商产品文本评论提出了一个新的融合Stacking 集成思想和深度学习算法模型。首先在文本信息特征提取层使用Chinese-BERT-wwm 生成含有丰富语义信息的动态句子表征向量, Chinese-BERT-wwm 是专门针对中文特点改进后的预训练模型, 具有稳健的中文文本特征信息提取能力, 其次该层同时设计了TextCNN 和BiLSTM捕获文本中局部关键信息特征与语序信息特征, 并将这些特征拼接在一起以获得更全面丰富的句子信息, 最后基于Stacking 集成学习思想使用SVM 对该特征进行分类。为了评估模型效果, 人工标注3 万条具有三类情感极性的中文电商产品文本数据进行实验, 该数据集可广泛用于中文情感分析领域。实验结果表明, 与基线模型相比, 提出的模型可以有效提高中文文本情感极性分类任务的准确率。相似文献

3.

一种增量式Bayes文本分类算法

高洁吉根林《南京师范大学学报》2004,4(3):49-52

文本自动分类是数据挖掘和机器学习中非常重要的研究领域 .针对难以获得大量有类标签的训练集问题 ,提出了基于小规模标注语料的增量式Bayes文本分类算法 .该算法分两种情况处理 :第一种情况是新增样本有类标签 ,可直接重新计算样本属于某类别的条件概率 .第二种情况是新增样本无类标签 ,则利用现有分类器为其训练类标签 ,然后利用新样本来修正分类器 .实验结果表明 ,该算法是可行有效的 ,比Na veBayes文本分类算法有更高的精度 .增量式Bayes分类算法的提出为分类器的更新提供了一条新途径相似文献

4.

基于功能基的专利信息挖掘与自动分类实验研究

刘龙繁李彦侯超异李文强《四川大学学报(工程科学版)》2016,48(5):105-113

为了在产品创新设计过程为设计者提供跨领域的专利知识,提出一种以功能基为分类标准的中文专利文本分类方法。针对功能基类别多、专利文本训练集少的特点,从简化类别数量和增加数据集2个角度出发,采用多重二分类监督分类算法和基于EM算法的半监督分类算法,以朴素贝叶斯(NB)完全有监督算法为对照,采用正交实验,考察特征选择与数据集选择对分类准确度的影响,实现一级功能基分类准确率达到80%,基本符合应用要求。为基于功能基辅助产品创新设计专利知识库的构建,提供了相关的技术支持。相似文献

5.

中文短文本分类技术研究综述

下载免费PDF全文

刘硕王庚润李英乐郭程远《信息工程大学学报》2021,22(3):304-312

随着信息技术的迅速发展,网络上产生了海量的中文短文本数据。利用中文短文本分类技术,在低信息量的数据中挖掘出有价值的信息是当前的一个研究热点。中文短文本相较于长文本,存在字数少、歧义多、特征稀疏和信息不规范等特点,导致使用传统文本分类技术效果不佳。首先介绍中文短文本分类技术的研究现状;其次围绕中文短文本分类的基本流程和关键技术进行阐述,并对文本预处理、文本表示、特征扩展和分类算法做出详细介绍;最后对中文短文本分类技术未来发展的趋势进行展望。相似文献

6.

多视图交叉一致性学习的半监督水面目标检测

冯俊健李彬田联房董超《哈尔滨工业大学学报》2023,55(4):107-114

为缓解基于半监督学习的水面目标检测对有限标注样本过拟合的问题，提高无标注样本中目标提取的有效性，提出了基于多视图交叉一致性学习的半监督水面目标检测算法。首先，该算法通过数据增强的方式为训练样本生成不同的视图以丰富数据集的多样性；然后，利用所提出的多视图目标判别器为无标注样本在线生成伪标签，有助于提取无标注样本的有效信息；最后，利用所提出的多视图交叉一致性学习使同一目标实例的不同视图的输出实现交叉一致性正则化，以促进检测模型学习判别性的特征从而降低过拟合的风险。在海上和内河数据集上的实验结果表明：文中所提算法能够提高特征提取的判别性，对多类别的水面目标检测精度达到91.0%,比全监督检测算法提高了18.7%,比其他半监督检测算法提高了3.8%以上；在检测速度上，该算法达到13.1帧/s,基本满足实时性要求。所提算法通过多视图交叉一致性学习提高特征的判别性和缓解检测模型的过拟合风险，有助于提高半监督水面目标检测的性能。相似文献

7.

融合标签语义嵌入和图卷积的短文本特征扩展及分类方法

张灵李荣臻郑苏《广东工业大学学报》2024,(1):69-78

针对短文本长度过短、关键词偏少和标签信息利用不足造成的分类过程中面临特征稀疏和语义不明确的问题,提出了融合标签语义嵌入的图卷积网络模型。首先,在传统的术语频率和逆文档频率算法基础上,提出了融合单词所属文本的类间、类内分布关系的全局词频提取算法。其次,利用融合标签嵌入的方法,将每条训练文本与相对应的标签引入到同一个特征空间内,通过筛选聚合提取更能突显文本类别的近义词嵌入,作为文本图的文档节点的嵌入表示。最后,将文本图输入到图卷积神经网络学习后,获得的特征与预训练模型提取文本上下文的特征相融合,提升短文本的分类质量以及整个模型的泛化能力,在4个短文本数据集MR、web＿snippets、R8和R52上对本文模型和14个基线算法进行了对比实验,结果表明本文提出的模型相比于对比模型具有更优的结果,在识别精度、召回率以及F₁值上有着更好的表现。相似文献

8.

基于ABC、XGBoost与迁移学习的入侵检测方法

黄清兰游贵荣《重庆科技学院学报(自然科学版)》2021,23(1):87-90

传统的入侵检测机器学习算法,面对有差异的新旧数据尤其是未知的攻击行为,会出现检测准确率较低、漏检率较高的问题.为此,提出了一种将人工蜂群(ABC)算法、XGBoost模型与迁移学习相结合的ABC-XGBTrl算法.首先通过使用少量有标签的新数据训练初始分类模型,然后将有标签的旧数据中分类正确的部分与少量有标签的新数据合并,用于训练新的迁移分类模型,最终用来检测未使用的新数据.迁移分类模型中的分类算法使用XGBoost,并利用人工蜂群算法优化XG-Boost的参数.采用NSL-KDD数据集进行了测试,结果表明,这种方法比现有的一些经典集成学习算法具有更高的检测准确率. 相似文献

9.

类别语义信息对齐的无监督领域自适应网络

贾熹滨李启铭王珞《北京工业大学学报》2023,(5):523-531

针对在目标应用场景中缺乏大量有标定训练数据的情况下难以获得有效的深度学习分类模型的问题，结合领域分布差异的方法与对抗学习方法的优势，提出以显式特征对齐与隐式领域对抗及类别对齐为基础的领域自适应框架.对于显式特征对齐模块，考虑到领域知识差异大带来的优化难题，采用渐进式协同优化策略，通过逐层减小不同语义层之间的领域差异，提升领域自适应性能.对于隐式类别对齐模块，为了增强目标特征的判别性，使用自训练方法获得伪标签，克服伪标签存在的标签噪声问题，并通过学习混淆矩阵优化伪标签的准确率，自动构造新的目标领域损失函数，从而在减小领域间差异的同时，提升源领域与目标领域相同类别的特征分布对齐的准确性.基于Office-31数据集的6个跨领域分类任务与基于Office-Home数据集的12组跨领域分类任务的实验结果表明，该方法在迁移学习任务上的平均分类准确率相较于基准方法分别提升11.9%和19.9%,所提出网络对于领域自适应任务是有效的. 相似文献

10.

融合主动学习的高光谱图像半监督分类

《哈尔滨工程大学学报》2017,(8)

针对高光谱数据维数高、有标签样本少等特点,采用半监督分类利用未标记样本信息提高高光谱图像分类精度。主动学习研究训练样本的选择方法,以少量的标记样本得到尽可能好的泛化能力。本文提出了一种结合主动学习算法的半监督分类算法。该方法使用支持向量机作为基本的学习模型,通过主动学习方法选取训练样本,以伪标记的形式加入到分类器的训练中,结合验证分类器迭代选出置信度较高的伪标记样本,通过差分进化算法交叉变异伪标记样本扩充标记样本群。在两个数据集上进行仿真实验,与传统分类算法相比,所提算法的总体分类精度分别提高了1.97%、0.49%,表明该算法能够有效地提升主动学习样本选择的效率,在有限带标记样本情况下提高了分类器精度。相似文献