首页 | 本学科首页   官方微博 | 高级检索  
     

融合矩阵分解和代价敏感的微生物数据扩增算法
引用本文:王曦,温柳英,闵帆.融合矩阵分解和代价敏感的微生物数据扩增算法[J].数据采集与处理,2023,38(2):401-412.
作者姓名:王曦  温柳英  闵帆
作者单位:西南石油大学计算机科学学院,成都 610500
基金项目:中央引导地方科技发展专项项目(2021ZYD0003);西南石油大学启航计划(2018QHR007)。
摘    要:微生物会对人类健康产生直接影响,对相关数据的分析有助于疾病诊断。然而,采集到的数据存在类不平衡与高稀疏性两个问题。现有的过采样方法在一定程度上可缓解数据的类不平衡,但是难以应对微生物数据的高稀疏性。本文提出了一种融合矩阵分解和代价敏感的数据扩增算法,其包含3个技术。首先,将原始矩阵分解为样本子空间和特征子空间;其次,利用样本子空间的正向量及其近邻向量生成合成向量;最后,根据合成向量与所有负向量的距离对其过滤。实验在8个微生物数据集上进行,同时与5种过采样算法对比,结果表明本文所提算法能够增强正样本的多样性,在识别出更多正样本的同时,分类结果的代价更低。

关 键 词:矩阵分解  代价敏感  微生物数据  高稀疏性  样本子空间  特征子空间
收稿时间:2022/5/18 0:00:00
修稿时间:2022/11/22 0:00:00

Fusing Matrix Factorization and Cost-Sensitive Microbial Data Augmentation Algorithm
Wang Xi,Wen Liuying,Min Fan.Fusing Matrix Factorization and Cost-Sensitive Microbial Data Augmentation Algorithm[J].Journal of Data Acquisition & Processing,2023,38(2):401-412.
Authors:Wang Xi  Wen Liuying  Min Fan
Affiliation:School of Computer Science, Southwest Petroleum University, Chengdu 610500, China
Abstract:
Keywords:matrix factorization  cost-sensitive  microbial data  high sparsity  sample subspace  feature subspace
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号