期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

皋军黄丽莉孙长银《自动化学报》2013,39(7):1037-1052

最大均值差异(Maximum mean discrepancy, MMD)作为一种能有效度量源域和目标域分布差异的标准已被成功运用.然而, MMD作为一种全局度量方法一定程度上反映的是区域之间全局分布和全局结构上的差异.为此, 本文通过引入局部加权均值的方法和理论到MMD中, 提出一种具有局部保持能力的投影最大局部加权均值差异(Projected maximum local weighted mean discrepancy, PMLWD)度量,%从而一定程度上使得PMLWD更能有效度量源域和目标域中局部分块之间的分布和结构上的差异,结合传统的学习理论提出基于局部加权均值的领域适应学习框架(Local weighted mean based domain adaptation learning framework, LDAF), 在LDAF框架下, 衍生出两种领域适应学习方法: LDAF_MLC和 LDAF_SVM.最后,通过测试人工数据集、高维文本数据集和人脸数据集来表明LDAF比其他领域适应学习方法更具优势. 相似文献

2.

核分布一致局部领域适应学习

陶剑文王士同《自动化学报》2013,39(8):1295-1309

针对领域适应学习(Domain adaptation learning, DAL)问题,提出一种核分布一致局部领域适应学习机(Kernel distribution consistency based local domain adaptation classifier, KDC-LDAC),在某个通用再生核Hilbert空间(Universally reproduced kernel Hilbert space, URKHS),基于结构风险最小化模型, KDC-LDAC首先学习一个核分布一致正则化支持向量机(Support vector machine, SVM),对目标数据进行初始划分; 然后,基于核局部学习思想,对目标数据类别信息进行局部回归重构; 最后,利用学习获得的类别信息,在目标领域训练学习一个适于目标判别的分类器.人造和实际数据集实验结果显示,所提方法具有优化或可比较的领域适应学习性能. 相似文献

3.

基于最大均值差异多源域迁移学习的湿式球磨机负荷参数软测量

阎高伟贺敏汤健韩东升《控制与决策》2018,33(10):1795-1800

针对湿式球磨机工况改变时,实时数据与建模数据分布不一致,不满足数据同分布的假设,传统软测量模型难以适应数据分布变化,造成模型性能恶化的问题,有针对性地引入迁移学习策略,并通过多源域集成机制提高模型的鲁棒性,实现多工况下湿式球磨机负荷参数测量.首先,对多工况数据进行预处理并提取频谱特征,经过联合分布适配对多工况数据进行边缘、条件分布适配;然后,使用最大均值差异对适配后的数据进行分布度量并为源域构建的回归器加权;最后,对目标域数据进行负荷预测.通过对比实验与交叉实验表明了模型的实用性和有效性. 相似文献

4.

基于领域适应嵌入的军事命名实体识别

刘凯张宏军陈飞琼《计算机科学》2022,49(1):292-297

为了解决单一军事领域语料不足导致的领域嵌入空间质量欠佳,使得深度学习神经网络模型识别军事命名实体精度较低的问题,文中从字词分布式表示入手,通过领域自适应方法由额外的领域引入更多有用信息帮助学习军事领域的嵌入.首先建立领域词典,将其与CRF算法结合,对收集到的通用领域语料和军事领域语料进行领域自适应分词,作为嵌入训练语料... 相似文献

5.

基于联合分布的多标记迁移学习

下载免费PDF全文

桑江徽姜海燕《计算机工程与应用》2021,57(9):154-161

针对现有的多标记迁移学习忽略条件分布而导致泛化能力不足的问题,设计了一种基于联合分布的多标记迁移学习(Multi-label Transfer Learning via Joint Distribution Alignment,J-MLTL).分解原始特征生成特征子空间,在子空间中计算条件分布的权重系数,最小化跨领域数... 相似文献

6.

基于最大均值差异的多标记迁移学习算法

姜海燕刘昊天舒欣徐彦伍艳莲郭小清《信息与控制》2016,45(4):463-470,478

针对多标记迁移学习中源领域与目标领域的特征分布差异会导致源领域数据无法被目标领域利用的问题,提出了一种基于最大均值差异的多标记迁移学习算法（Multi-Label Transfer Learning via Maximum mean discrepancy,M-MLTL）,算法通过分解关系矩阵构造共享子空间,并采用最大均值差异（maximum mean discrepancy）作为评价指标,最小化子空间特征的分布差异,从而使源领域与目标领域的特征分布尽可能相似．多标记图像分类实验的结果表明,新算法比同类算法有更高的精度和计算效率．相似文献

7.

基于Beta分布和半监督学习的非确定性知识图谱嵌入模型

徐遥何世柱刘康张弛焦飞赵军《中文信息学报》2022,36(10):54-62

近年来,面向确定性知识图谱的嵌入模型在知识图谱补全等任务中取得了长足的进展,但如何设计和训练面向非确定性知识图谱的嵌入模型仍然是一个重要挑战。不同于确定性知识图谱,非确定性知识图谱的每个事实三元组都有着对应的置信度,因此,非确定性知识图谱嵌入模型需要准确地计算出每个三元组的置信度。现有的非确定性知识图谱嵌入模型结构较为简单,只能处理对称关系,并且无法很好地处理假负(false-negative)样本问题。为了解决上述问题,该文首先提出了一个用于训练非确定性知识图谱嵌入模型的统一框架,该框架使用基于多模型的半监督学习方法训练非确定性知识图谱嵌入模型。为了解决半监督学习中半监督样本噪声过高的问题,我们还使用蒙特卡洛Dropout计算出模型对输出结果的不确定度,并根据该不确定度有效地过滤了半监督样本中的噪声数据。此外,为了更好地表示非确定性知识图谱中实体和关系的不确定性以处理更复杂的关系,该文还提出了基于Beta分布的非确定性知识图谱嵌入模型UBetaE,该模型将实体、关系均表示为一组相互独立的Beta分布。在公开数据集上的实验结果表明,结合该文所提出的半监督学习方法和UBetaE模型,不仅... 相似文献

8.

结合判别分析和分布差异约束的领域适应方法

覃姜维唐德玉《计算机工程与应用》2024,(2):77-86

为解决领域适应过程中基于全局分布适配的特征变换造成的类别结构损失和局部特征损失问题,提出一种结合判别分析和分布差异约束的领域适应方法。构造领域数据分布均值距离度量用于领域间分布适配;构造类散度度量用于保持类别判别结构;基于数据局部分布信息设计不同类型的差异权重,分别用于约束域分布距离度量和类散度度量,实现判别保持和局部保持的联合优化;基于上述度量最优化的特征变换,将源域和目标域数据投影到子空间中实施分类任务。所提出的方法在领域适应过程中不仅能够缩小领域间分布差异,且兼顾类别判别保持和数据局部特征的保持,能有效提升域外数据重用的性能。在28组跨领域分类任务上的实验结果表明,所提出的方法在评价指标上优于已有的相关方法。相似文献

9.

基于类内最大均值差异的无监督领域自适应算法

蔡瑞初李嘉豪郝志峰《计算机应用研究》2020,37(8):2371-2375

传统的无监督领域自适应算法在对齐总体分布时存在分类信息流失问题,难以保证迁移学习效果。针对这个问题,提出了一种基于类内最大均值差异的分布对齐策略。该策略首先预测所有样本的伪标签,然后借助伪标签样本信息依次对齐每个类别的领域类内分布。在深度学习框架下,所提算法能够有效保留分类信息,提高了目标领域的预测能力。实验结果表明,与传统算法比较,所提算法在多个基准数据集上获得了最优的迁移学习效果。相似文献

10.

基于自然邻居的标记分布学习

姚成亮朱庆生《计算机科学》2020,47(8):132-136

标记分布是一种新的机器学习范式,能很好地解决某些标记多义性问题,可看作多标记的泛化。传统的单标记学习和多标记学习均可看作标记分布学习的特例。已有的标记分布学习算法中,基于算法改造的AA-KNN(Algorithm Adaptation-KNN)是一种高效的算法,但任何涉及K近邻求解问题的算法在处理不同数据集时,参数K值的选取都是一个难题,不同的K值得到的结果明显不同。基于此,将自然最近邻居的概念引入标记分布学习,提出一种新的标记分布学习方法。对数据集使用自然最近邻居搜索算法查找每个样本的自然邻居,取自然邻居的标记分布均值作为预测结果。搜索算法不需要人工设置任何参数,同时搜索算法是一种被动搜索,其自适应计算得到每个样本的邻居。在6个数据集上使用6个评价指标进行实验,结果表明,与AA-KNN相比,结合自然最近邻居的标记分布学习算法不仅避免了人工设置参数的问题,而且取得了更优的效果。相似文献

11.

Maximum Mean and Covariance Discrepancy for Unsupervised Domain Adaptation

Zhang Wenju Zhang Xiang Lan Long Luo Zhigang 《Neural Processing Letters》2020,51(1):347-366

Neural Processing Letters - A fundamental research topic in domain adaptation is how best to evaluate the distribution discrepancy across domains. The maximum mean discrepancy (MMD) is one of the... 相似文献

12.

基于深度学习的域适应方法综述

田青朱雅喃马闯《数据采集与处理》2022,37(3):512-541

域适应主要应对跨不同数据分布的相似任务决策问题。作为机器学习领域的一个新兴分支,域适应受到了众多的研究和关注。随着近年深度学习的兴起,深度学习和域适应相结合的深度域适应研究得到了更多的关注。尽管已有各种深度域适应方法被提出,却鲜有系统的综述工作发表。为此,本文重点对现有的深度域适应方法进行全面回顾、分析和总结,为相关研究人员提供借鉴和参考。本文主要贡献包括以下方面：首先,对域适应的背景、概念和应用领域进行概括总结。其次,根据模型是否涉及对抗训练机制,将现有深度域适应划分为深度对抗域适应和深度非对抗域适应两大类方法,并逐类回顾和分析。然后,对常用的实验基准数据集进行归类和总结。最后,对现有深度域适应工作存在的问题和不足进行了归纳分析,并讨论了将来的可行研究方向。相似文献

13.

基于Active Learning的中文分词领域自适应

许华婷张玉洁杨晓晖单华徐金安陈钰枫《中文信息学报》2015,29(5):55-63

在新闻领域标注语料上训练的中文分词系统在跨领域时性能会有明显下降。针对目标领域的大规模标注语料难以获取的问题,该文提出Active learning算法与n-gram统计特征相结合的领域自适应方法。该方法通过对目标领域文本与已有标注语料的差异进行统计分析,选择含有最多未标记过的语言现象的小规模语料优先进行人工标注,然后再结合大规模文本中的n-gram统计特征训练目标领域的分词系统。该文采用了CRF训练模型,并在100万句的科技文献领域上,验证了所提方法的有效性,评测数据为人工标注的300句科技文献语料。实验结果显示,在科技文献测试语料上,基于Active Learning训练的分词系统在各项评测指标上均有提高。
相似文献

14.

域自适应学习研究进展 总被引：2，自引：0，他引：2

刘建伟孙正康罗雄麟《自动化学报》2014,40(8):1576-1600

传统的机器学习假设测试样本和训练样本来自同一概率分布. 但当前很多学习场景下训练样本和测试样本可能来自不同的概率分布. 域自适应学习能够有效地解决训练样本和测试样本概率分布不一致的学习问题,作为机器学习新出现的研究领域在近几年受到了广泛的关注. 鉴于域自适应学习技术的重要性,综述了域自适应学习的研究进展. 首先概述了域自适应学习的基本问题,并总结了近几年出现的重要的域自适应学习方法. 接着介绍了近几年提出的较为经典的域自适应学习理论和当下域自适应学习的热门研究方向,包括样例加权域自适应学习、特征表示域自适应学习、参数和特征分解域自适应学习和多源域自适应学习. 然后对域自适应学习进行了相关的理论分析,讨论了高效的度量判据,并给出了相应的误差界. 接着对当前域自适应学习在算法、模型结构和实际应用这三个方面的研究新进展进行了综述. 最后分别探讨了域自适应学习在特征变换和假设、训练优化、模型和数据表示、NLP 研究中存在的问题这四个方面的有待进一步解决的问题. 相似文献

15.

基于类分布的领域自适应支持向量机 总被引：2，自引：0，他引：2

应文豪王士同邓赵红王骏《自动化学报》2013,39(8):1273-1288

现有的领域自适应方法在定义领域间分布距离时, 通常仅从领域样本的整体分布上考虑, 而未对带类标签的领域样本分布分别进行考虑, 从而在一些具有非平衡数据集的应用领域上表现出一定的局限性. 对此, 在充分考虑源领域样本类信息的基础上, 基于结构风险最小化模型, 提出了基于类分布的领域自适应支持向量机(Domain adaptation support vector machine based on class distribution, CDASVM), 并将其拓展为可处理多源问题的多源领域自适应支持向量机(CDASVM from multiple sources, MSCDASVM), 在人造和真实的非平衡数据集上的实验结果表明, 所提方法具有优化或可比较的模式分类性能. 相似文献

16.

加权解耦语义表达的多源领域自适应方法

蔡瑞初郑丽娟李梓健《软件学报》2022,33(12):4517-4533

近年来,深度学习受到越来越多研究者的重视并成功应用于许多领域.虽然深度学习在这些领域获得了巨大的成功,但是数据采集和标注成本高,严重限制了深度学习的推广应用.迁移学习不仅可以打破训练集数据和测试集数据独立同分布的假设,而且可以利用有标签的迁移源数据和没有标签的迁移目标数据训练得到具有良好泛化能力的模型,是扩展深度学习应用场景的重要研究方向.在众多的迁移学习方法中,多源领域自适应方法可以充分利用多个迁移源的信息,具有重要的实际价值.从数据的因果生成机制出发,假设观测数据由语义隐变量和领域隐变量这两组独立的隐变量同时生成.基于上述假设,提出了一种基于多种距离度量框架和加权解耦语义表达的多源领域自适应方法.该方法利用了双重对抗网络来提取解耦的语义信息和领域信息;另一方面,采用了3种不同的语义信息聚合策略获得领域不变的语义表达;最后使用领域不变的语义表达进行图片分类.在多个多源领域自适应数据上的对比及鲁棒性分析实验中,充分地验证了所提出方法的有效性. 相似文献

17.

基于领域特征的神经机器翻译领域适应方法

谭敏段湘煜张民《中文信息学报》2019,33(7):56-64

神经机器翻译在资源丰富领域上训练的翻译模型往往在其他资源稀缺领域中表现较差,领域适应是利用资源丰富的领域帮助资源稀少的领域提升翻译质量的一种方法。该文提出基于领域特征的领域适应方法以提升资源稀缺领域的神经机器翻译质量。具体而言,该文尝试构建领域敏感网络以获得领域特有特征,构建领域不敏感网络以获得领域间的共有特征。一个领域判别器被用于区分领域。该文通过训练领域敏感网络使得该领域判别器更易做出准确判断,同时引入对抗机制,使得领域不敏感网络欺骗该领域判别器。最后,提出一种系统集成机制,融合基准神经翻译网络、领域敏感网络、领域不敏感网络以完成神经机器翻译的领域适应。实验结果显示,该方法在中英广播对话领域上和英德口语领域上的翻译效果均有显著提升。相似文献