共查询到20条相似文献,搜索用时 78 毫秒
1.
基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计,以期缓解关联数据稀疏和PU问题的影响。然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,与目前流行的基因-疾病关联预测方法相比,所提出的模型在查全率和查准率上均有显著提高,同时也能解决关联预测中常见的冷启动问题。 相似文献
2.
针对图卷积编码器提取用户、项目信息过程中权重共享,不能区分邻域之间重要性,以及知识图谱作为辅助信息时,基于图神经网络方法无法显示对知识图谱非本地上下文(最相关的高阶邻居集合)信息进行捕获的问题,提出一种基于双向交互图传递的图注意编码器框架,显示利用知识图谱本地(一阶邻居集合)和非本地上下文信息。通过图注意编码器获取用户、项目的嵌入向量;考虑用户对实体的个性化偏好,通过特定于用户的图注意机制来捕获知识图的本地上下文信息;使用随机游走抽样提取实体的非本地上下文,并使用递归神经网络建模实体与非本地上下文实体之间的依赖关系,通过一个双线性解码器重建二部图中的链接。与现有的方法相比,在真实数据集上的实验结果验证了该模型的优越性。 相似文献
3.
大部分现有的用于预测环状RNA(circRNA)与疾病之间关联关系的计算模型通常使用circRNA和疾病相关数据等生物学知识,配合已知的circRNA-疾病关联信息对来挖掘出潜在的关联信息.然而这些模型受已知关联构成的网络稀疏性、负样本过少等固有问题的影响,导致预测性能不佳.因此,在图自动编码器基础上引入归纳式矩阵补全及自注意力机制进行二阶段融合,以实现circRNA-疾病关联预测,由此构建的模型叫GIS-CDA(Graph auto-encoder combining Inductive matrix complementation and Self-attention mechanism for predicting CircRNA-Disease Association).首先,计算circRNA集成和疾病集成的相似性,并利用图自动编码器学习circRNA和疾病的潜在特征,以获得低维表征;接着,将学习到的特征输入归纳式矩阵补全,以提高节点之间的相似性和依赖性;然后,将circRNA特征矩阵和疾病特征矩阵整合为circRNA-疾病特征矩阵,以增强预测的稳定性和精确性;最后,引入自注意力机制,从特征矩阵中提取重要特征,并减少对其他生物信息的依赖.五折交叉和十折交叉验证的结果显示:GIS-CDA获得的平均接收者操作特征曲线下面积(AUROC)值分别为0.930 3和0.939 3,前者比基于KATZ测度的人类circRNA-疾病关联预测模型(KATZHCDA)、基于深度矩阵分解方法的circRNA-疾病关联(DMFCDA)预测模型、RWR(Random Walk with Restart)和基于加速归纳式矩阵补全的circRNA-疾病关联(SIMCCDA)预测模型分别高出了13.19、35.73、13.28和5.01个百分点;GIS-CDA的精确率-召回率曲线下面积(AUPR)值分别为0.227 1和0.234 0,前者比上述对比模型分别高出了21.72、22.43、21.96和13.86个百分点.此外,在circRNADisease、circ2Disease和circR2Disease数据集上的消融实验和案例研究进一步验证了GIS-CDA在预测circRNA-疾病的潜在关联方面具有较好的性能. 相似文献
4.
西南地区降雨频繁且无规律的特性,导致传统降雨预测方法在此处难以实行。对此提出采用序列张量补全(STC)的数据优化方式。以四川自贡市地区逐日实测的降雨数据为数据集进行模型建立,得出了在一定条件下未来值确实可以从历史观测数据中恢复的结论。与中央气象台的预报指导产品(SCMOC)和各省的订正预报产品(SPCC)两种方法进行比较,结果表明该方法得到了较好的预测效果。 相似文献
5.
许多科学研究都需要对环境数据进行分析,这些环境数据通常是通过部署在研究区域内的无线传感器网络(Wireless sensor networks, WSNs)来收集的。收集数据的完整性和准确性决定了科研结果的可靠性。然而,在数据收集过程中普遍存在的数据丢失和错误影响了收集数据的可用性,为此需要利用收集到的数据重建完整的环境数据。基于环境数据低秩特性,将数据重建问题建模为L2,1范数正则化矩阵补全模型,提出一种基于结构化噪声矩阵补全的WSNs收集数据重建方法(Data reconstruction approach via matrix completion with structural noise, DRMCSN)。真实数据集上的实验结果表明,该方法性能优于现有算法,不仅能以较高的精度恢复缺失的环境数据,而且能辨识出收集到错误数据的传感器节点。 相似文献
6.
针对基于归纳关系预测的知识图谱补全方法,现有的方法仅限于直推式推理,训练期间必须知道全部的实体集合。提出一种基于图神经网络的关系预测方法。首先提取图神经网络的局部有向子图进行推理,其次引入一个用于归纳关系推理的节点-边双向信息传递机制,以加强节点和边之间的信息交流并有效处理三元组中的非对称关系。鉴于实体之间不同的连接路径揭示了其关系的本质并有助于预测推理,因此考虑两个实体之间的关系路径,用适用于归纳式推理的关系类型表示其路径,定义了边嵌入的注意力公式,对在训练集中没有见过的实体进行关系预测。在适用于归纳推理方法的常用基准数据集上的实验结果表明,该方法相比基线模型提高了三元组的预测精度。 相似文献
7.
8.
伪装目标检测(COD)旨在检测隐藏在复杂环境中的目标。现有COD算法在结合多层次特征时,忽略了特征的表达和融合方式对检测性能的影响。为此,提出一种基于递进式特征增强聚合的COD算法。首先,通过主干网络提取多级特征;然后,为了提高特征的表达能力,使用由特征增强模块(FEM)构成的增强网络对多层次特征进行增强;最后,在聚合网络中设计邻近聚合模块(AAM)实现相邻特征之间的信息融合,以突显伪装目标区域的特征,并提出新的递进式聚合策略(PAS)通过渐进的方式聚合邻近特征,从而在实现多层特征有效融合的同时抑制噪声。在3个公开数据集上的实验表明,所提算法相较于12种最先进的算法在4个客观评价指标上均取得最优表现,尤其是在COD10K数据集上所提算法的加权的F测评法和平均绝对误差(MAE)分别达到了0.809和0.037。由此可见,所提算法在COD任务上拥有较优的性能。 相似文献
9.
节点定位是实现无线传感器网络(wireless sensor networks, WSNs)应用的重要前提之一.针对传统基于测距的定位方法需要大量节点距离信息以及多径效应、噪声干扰等导致的节点测距误差问题,提出了一类基于L1范数正则化矩阵补全(L1-norm regularized matrix completion, L1NRMC)的WSNs节点定位方法.该方法基于传感网节点间距离矩阵低秩特性,将部分采样信息下的距离恢复问题建模为稀疏野值噪声(outlier)情形下的矩阵补全问题,然后采用交替方向乘子法(alternating direction method of multipliers, ADMM)结合算子分裂技术(operator splitting technology)对该问题进行求解,所设计的非精确L1范数正则化矩阵补全(InExact-L1NRMC)算法不仅能显式解析采样矩阵中的稀疏野值噪声,也可隐式平滑常见的高斯随机噪声.仿真结果表明:相比已有的同类定位方法,该算法只需进行部分测距采样即可实现精准的节点定位,且对各类测距噪声具有很好的抗干扰能力,适用于资源受限的WSNs. 相似文献
10.
11.
12.
点击率预估是推荐系统中的核心任务,其关键是学习有效的特征交互,但现有基于深度神经网络的点击率预估方法未考虑冷启动问题,导致准确率降低。结合特征信息和域信息的嵌入,提出一种特征交互的点击率预估方法FF-GNN。利用基于图神经网络的交互模块分别提取特征嵌入和域嵌入的结构信息,建模细粒度的特征交互和粗粒度的域交互过程。同时通过设计图神经网络的权重计算模块,交叉引用特征图神经网络和域图神经网络的低阶特征信息,实现特征交互和个性化建模域交互。在此基础上,采用注意力机制融合特征交互和域交互模块的结果预测点击率。在Criteo和Frappe公开数据集上的实验结果验证了FF-GNN方法的有效性,其AUC指标相较于同类型Fi-GNN方法分别提高0.57和0.85个百分点,能够同时关注特征和域信息,提高点击率预估的准确度。 相似文献
13.
稀疏矩阵向量乘(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用在经济学模型、信号处理等科学计算和工程应用中,对于SpMV及其调优技术的研究有助于提升解决相关领域问题的运算效率。传统SpMV自动调优方法基于硬件平台的体系结构参数设置来提升SpMV性能,但巨大的参数设置量导致搜索空间变大且自动调优耗时大幅增加。采用深度学习技术,基于卷积神经网络,构建由双通道稀疏矩阵特征融合以及稀疏矩阵特征与体系结构特征融合组成的SpMV运算性能预测模型,实现快速自动调优。为提高SpMV运算时间的预测精度,选取特征数据并利用箱形图统计SpMV时间信息,同时在佛罗里达稀疏矩阵数据集上进行实验设计与验证,结果表明,该模型的SpMV运算时间预测准确率达到80%以上,并且具有较强的泛化能力。 相似文献
14.
短文本分类是自然语言处理(NLP)中的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在的数据稀疏性问题,通过引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出了一个融合节点和边权值特征的图注意力网络NE-GAT。首先,针对每个语料库构建异构图,利用引力模型(GM)评估单词节点的重要性,并通过节点间的点互信息(PMI)获得边权重;其次,为每个句子构建文本级别图,并将节点重要性和边权重融入节点更新过程。实验结果表明,所提模型在测试集上的平均准确率达到了75.48%,优于用于文本分类的图卷积网络(Text-GCN)、TL-GNN、Text-ING等模型;相较原始GAT,所提模型的平均准确率提升了2.32个百分点,验证了其有效性。 相似文献
15.
命名实体识别指识别文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。在命名实体识别任务中,协同图网络(CGN)模型通过引入多个图注意力网络获得较强的知识整合能力及较高的处理速度,但CGN模型在嵌入层中没有充分利用词边界信息,且采用的传统静态图注意力网络影响了图注意力的表达能力。在对CGN模型的图注意力网络进行改进的基础上,提出一种中文命名实体识别新模型,在嵌入层融入词语的分词信息,以生成包含词边界信息的字向量,从而充分利用词边界信息。通过在编码层使用BiLSTM模型获取文本的上下文信息,采用改进后的图注意力网络提取文本特征,并通过优化传统图注意力网络中相关系数的计算方式,增强模型的特征提取能力。最后,利用条件随机场对文本进行解码,从而实现对实体的标注。实验结果表明,该模型相比CGN模型在MSRA、OntoNotes4.0、Weibo数据集上的F1值分别提升了0.67%、3.16%、0.16%,验证了其在中文命名实体识别任务上的有效性。 相似文献
16.
传统点击率(CTR)预测模型多在单一特征级上进行特征交互,未能充分利用不同特征级上的有效信息。基于特征增强聚合方法提出一种融合广告CTR预测(APNN)模型。在CTR预测模型的嵌入层中引入一阶信息重要性进行特征增强,通过注意力因子分解机(AFM)模型与基于乘积产生层的神经网络(PNN)模型融合不同特征级交互特征和增强的嵌入特征,并利用多个全连接层从融合特征中获得更多潜在的高阶信息。实验结果表明,相比AFM、PNN、FNN等模型,APNN模型的预测精度较高,其在Criteo数据集上的AUC和LogLoss指标较PNN模型分别提高1.74和1.42个百分点。 相似文献
17.
城市路网交通速度预测是智能交通系统中的重要组成部分,其可为出行者提供实时的交通信息,对提升道路通行能力具有重要意义。现有基于图卷积网络的预测模型一定程度上加强了对一阶相邻路段间空间关联程度的挖掘,但在非一阶相邻路段关联度大于一阶相邻路段关联度的情况下,如果仍输入原始的邻接矩阵,会遗失一些相对重要的路段空间信息,无法得到较好的预测结果。为准确挖掘城市路网中的时空特性,提出一种基于全局图卷积和门控循环单元的城市路网交通速度预测模型G-GCGRU。考虑全局路网下非一阶相邻路段间的空间影响程度,利用相关性分析方法计算得到路段间的关联度矩阵,并作为新的卷积方式进一步加深对空间特征的挖掘,在此基础上,采用门控循环单元方法提取路网时间特征。使用深圳市罗湖区城市路网车速数据进行实验,结果表明,该模型预测性能优于图卷积网络(GCN)、门控循环单元(GRU)和GCN-GRU混合模型,以均方根误差为评价指标,预测精度分别提高25.3%、4.7%和2.1%。 相似文献
18.
路段行程车速的变化受时间和空间维度信息的综合影响,多数神经网络模型仅从时间维度上预测路段行程车速的变化规律,未能全面考虑路网结构和上下游交通状态对路段行程车速的影响。结合图卷积网络和门控循环单元构建深度学习模型,挖掘路段行程车速的时空特性。通过在线地图平台获取路段实时行程车速,使用等维递补方法更新历史序列数据,提高预测实时性。在深圳市部分区域路网上的实验结果表明,该模型的多步预测精度均在90%以上,相比自回归积分滑动平均模型、支持向量机回归模型和门控循环单元模型最高提升了6.9%、1.3%和0.4%,具有更优的路段行程车速预测效果。 相似文献
19.
20.
针对支持向量机(SVM)、长短期记忆(LSTM)网络等智能算法在股市波动预测过程中股票评价特征选择困难及时序关系维度特征缺失的问题,为能够准确预测股票波动、有效防范金融市场风险,提出了一种基于改进遗传算法(IGA)和图神经网络(GNN)的股市波动预测方法——IGA-GNN。首先,利用相邻交易日间的时序关系构建股市交易指标图数据;其次,通过评价指标特性优化交叉、变异概率来改进遗传算法(GA),从而实现节点特征选择;然后,建立图数据的边与节点特征的权重矩阵;最后,运用GNN进行图数据节点的聚合与分类,实现了股市波动预测。在实验阶段,所研究的股票总评价指标数为130个,其中IGA在GNN方法下提取的有效评价指标87个,使指标数量降低了33.08%。应用所提IGA在智能算法中进行特征提取,得到的算法与未进行特征提取的智能算法相比,预测准确率整体提升了7.38个百分点;而与应用传统GA进行智能算法的特征提取相比,应用所提IGA进行智能算法的特征提取的总训练时间缩短了17.97%。其中,IGA-GNN方法的预测准确率最高,相较未进行特征提取的GNN方法的预测准确率整体提高了19.62个百分点;而该方法与用传统GA进行特征提取的GNN方法相比,训练时间平均缩短了15.97%。实验结果表明,所提方法可对股票特征进行有效提取,预测效果较好。 相似文献