共查询到20条相似文献,搜索用时 46 毫秒
1.
基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足;提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地;先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计;以期缓解关联数据稀疏和PU问题的影响。然而;受制于相似度网络的质量;Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声;为此;将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性;进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明;与目前流行的基因-疾病关联预测方法相比;所提出的模型在查全率和查准率上均有显著提高;同时也能解决关联预测中常见的冷启动问题。 相似文献
2.
针对图卷积编码器提取用户、项目信息过程中权重共享,不能区分邻域之间重要性,以及知识图谱作为辅助信息时,基于图神经网络方法无法显示对知识图谱非本地上下文(最相关的高阶邻居集合)信息进行捕获的问题,提出一种基于双向交互图传递的图注意编码器框架,显示利用知识图谱本地(一阶邻居集合)和非本地上下文信息。通过图注意编码器获取用户、项目的嵌入向量;考虑用户对实体的个性化偏好,通过特定于用户的图注意机制来捕获知识图的本地上下文信息;使用随机游走抽样提取实体的非本地上下文,并使用递归神经网络建模实体与非本地上下文实体之间的依赖关系,通过一个双线性解码器重建二部图中的链接。与现有的方法相比,在真实数据集上的实验结果验证了该模型的优越性。 相似文献
3.
大部分现有的用于预测环状RNA(circRNA)与疾病之间关联关系的计算模型通常使用circRNA和疾病相关数据等生物学知识,配合已知的circRNA-疾病关联信息对来挖掘出潜在的关联信息.然而这些模型受已知关联构成的网络稀疏性、负样本过少等固有问题的影响,导致预测性能不佳.因此,在图自动编码器基础上引入归纳式矩阵补全及自注意力机制进行二阶段融合,以实现circRNA-疾病关联预测,由此构建的模型叫GIS-CDA(Graph auto-encoder combining Inductive matrix complementation and Self-attention mechanism for predicting CircRNA-Disease Association).首先,计算circRNA集成和疾病集成的相似性,并利用图自动编码器学习circRNA和疾病的潜在特征,以获得低维表征;接着,将学习到的特征输入归纳式矩阵补全,以提高节点之间的相似性和依赖性;然后,将circRNA特征矩阵和疾病特征矩阵整合为circRNA-疾病特征矩阵,以增强预测的稳定性和精确性;最后,引入自注意力机制,从特征矩阵中提取重要特征,并减少对其他生物信息的依赖.五折交叉和十折交叉验证的结果显示:GIS-CDA获得的平均接收者操作特征曲线下面积(AUROC)值分别为0.930 3和0.939 3,前者比基于KATZ测度的人类circRNA-疾病关联预测模型(KATZHCDA)、基于深度矩阵分解方法的circRNA-疾病关联(DMFCDA)预测模型、RWR(Random Walk with Restart)和基于加速归纳式矩阵补全的circRNA-疾病关联(SIMCCDA)预测模型分别高出了13.19、35.73、13.28和5.01个百分点;GIS-CDA的精确率-召回率曲线下面积(AUPR)值分别为0.227 1和0.234 0,前者比上述对比模型分别高出了21.72、22.43、21.96和13.86个百分点.此外,在circRNADisease、circ2Disease和circR2Disease数据集上的消融实验和案例研究进一步验证了GIS-CDA在预测circRNA-疾病的潜在关联方面具有较好的性能. 相似文献
4.
西南地区降雨频繁且无规律的特性,导致传统降雨预测方法在此处难以实行。对此提出采用序列张量补全(STC)的数据优化方式。以四川自贡市地区逐日实测的降雨数据为数据集进行模型建立,得出了在一定条件下未来值确实可以从历史观测数据中恢复的结论。与中央气象台的预报指导产品(SCMOC)和各省的订正预报产品(SPCC)两种方法进行比较,结果表明该方法得到了较好的预测效果。 相似文献
5.
6.
许多科学研究都需要对环境数据进行分析,这些环境数据通常是通过部署在研究区域内的无线传感器网络(Wireless sensor networks, WSNs)来收集的。收集数据的完整性和准确性决定了科研结果的可靠性。然而,在数据收集过程中普遍存在的数据丢失和错误影响了收集数据的可用性,为此需要利用收集到的数据重建完整的环境数据。基于环境数据低秩特性,将数据重建问题建模为L2,1范数正则化矩阵补全模型,提出一种基于结构化噪声矩阵补全的WSNs收集数据重建方法(Data reconstruction approach via matrix completion with structural noise, DRMCSN)。真实数据集上的实验结果表明,该方法性能优于现有算法,不仅能以较高的精度恢复缺失的环境数据,而且能辨识出收集到错误数据的传感器节点。 相似文献
7.
针对基于归纳关系预测的知识图谱补全方法,现有的方法仅限于直推式推理,训练期间必须知道全部的实体集合。提出一种基于图神经网络的关系预测方法。首先提取图神经网络的局部有向子图进行推理,其次引入一个用于归纳关系推理的节点-边双向信息传递机制,以加强节点和边之间的信息交流并有效处理三元组中的非对称关系。鉴于实体之间不同的连接路径揭示了其关系的本质并有助于预测推理,因此考虑两个实体之间的关系路径,用适用于归纳式推理的关系类型表示其路径,定义了边嵌入的注意力公式,对在训练集中没有见过的实体进行关系预测。在适用于归纳推理方法的常用基准数据集上的实验结果表明,该方法相比基线模型提高了三元组的预测精度。 相似文献
8.
9.
现有的煤自燃温度预测模型仅考虑监测数据前后的时间关联性,未考虑监测点之间的空间关系,并存在多步长煤自燃温度预测精度低的问题。针对上述问题,提出了一种基于图注意力网络(GAT)和Informer模型(GAT−Informer)的采空区煤自燃温度预测模型。首先,采用随机森林回归法和Savitzky−Golay滤波器对采空区沿空侧煤自燃监测数据中的异常值、缺失值和噪声进行处理,并使用Z−score方法对数据进行标准化。其次,采用GAT提取多个监测点煤自燃监测数据间的空间特征。然后,使用Informer模型的编码器对包含空间特征的数据进行编码,利用多头概率稀疏自注意力机制捕捉数据之间的长期依赖关系和时间特征;解码器通过交叉注意力机制与编码器交互,结合编码器提取的全局特征与目标序列的上下文依赖关系,生成特征矩阵并输入全连接层,得到煤自燃温度预测值。最后,对Informer模型输出的煤自燃温度预测值进行反标准化处理,恢复到原始数据尺度,得到最终的预测结果。实验结果表明,相较于循环神经网络(RNN)、长短期记忆网络(LSTM)、门控循环单元(GRU)和Informer模型,GAT−Informer模型在6个监测点上预测24步长煤自燃温度时,均方误差(MSE)分别平均降低了15.70%,22.15%,25.45%,36.49%,平均绝对误差(MAE)分别平均降低了16.01%,14.60%,20.30%,26.27%,表明GAT−Informer模型能有效提高煤自燃温度多步长预测精度。 相似文献
10.
伪装目标检测(COD)旨在检测隐藏在复杂环境中的目标。现有COD算法在结合多层次特征时,忽略了特征的表达和融合方式对检测性能的影响。为此,提出一种基于递进式特征增强聚合的COD算法。首先,通过主干网络提取多级特征;然后,为了提高特征的表达能力,使用由特征增强模块(FEM)构成的增强网络对多层次特征进行增强;最后,在聚合网络中设计邻近聚合模块(AAM)实现相邻特征之间的信息融合,以突显伪装目标区域的特征,并提出新的递进式聚合策略(PAS)通过渐进的方式聚合邻近特征,从而在实现多层特征有效融合的同时抑制噪声。在3个公开数据集上的实验表明,所提算法相较于12种最先进的算法在4个客观评价指标上均取得最优表现,尤其是在COD10K数据集上所提算法的加权的F测评法和平均绝对误差(MAE)分别达到了0.809和0.037。由此可见,所提算法在COD任务上拥有较优的性能。 相似文献
11.
短文本分类是自然语言处理(NLP)中的重要研究问题,广泛应用于新闻分类、情感分析、评论分析等领域。针对短文本分类中存在的数据稀疏性问题,通过引入语料库的节点和边权值特征,基于图注意力网络(GAT),提出了一个融合节点和边权值特征的图注意力网络NE-GAT。首先,针对每个语料库构建异构图,利用引力模型(GM)评估单词节点的重要性,并通过节点间的点互信息(PMI)获得边权重;其次,为每个句子构建文本级别图,并将节点重要性和边权重融入节点更新过程。实验结果表明,所提模型在测试集上的平均准确率达到了75.48%,优于用于文本分类的图卷积网络(Text-GCN)、TL-GNN、Text-ING等模型;相较原始GAT,所提模型的平均准确率提升了2.32个百分点,验证了其有效性。 相似文献
12.
《计算机工程》2024,51(3)
知识图谱补全旨在利用知识图谱中已有的知识推导出新的事实, 在多个任务和领域发挥重要作用, 引起研究者越来越多的关注。然而现有的知识图谱补全方法大多专注于对知识图谱中的事实三元组进行建模, 未充分考虑知识图谱中实体和关系之间所蕴涵的深层语义和关联。为了解决这个问题, 使用逻辑规则反映知识图谱中关系之间的隐含关联, 而知识图谱语义网络的本质决定了事实三元组周围高阶邻域中包含着深层语义信息。因此, 为了挖掘知识图谱中实体和关系的内在语义和关联, 提出一种基于逻辑规则和图神经网络(GNN)进行知识图谱补全模型。首先基于高效期望最大化(EM)迭代优化算法进行规则自动学习, 将得到的高质量逻辑规则与知识图谱中的实体和关系进行联合嵌入训练, 以实现对知识图谱中复杂关系模式的建模, 并提高嵌入表示的泛化性。同时, 考虑逻辑规则和三元组的重要性进行注意力嵌入传播, 以聚合高阶邻域信息, 最终得到融合深层语义和关联的实体、关系嵌入表示用于知识图谱补全。在4个公开数据集上针对链接预测任务进行实验, 实验结果证明了所提出模型的有效性。 相似文献
13.
命名实体识别指识别文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。在命名实体识别任务中,协同图网络(CGN)模型通过引入多个图注意力网络获得较强的知识整合能力及较高的处理速度,但CGN模型在嵌入层中没有充分利用词边界信息,且采用的传统静态图注意力网络影响了图注意力的表达能力。在对CGN模型的图注意力网络进行改进的基础上,提出一种中文命名实体识别新模型,在嵌入层融入词语的分词信息,以生成包含词边界信息的字向量,从而充分利用词边界信息。通过在编码层使用BiLSTM模型获取文本的上下文信息,采用改进后的图注意力网络提取文本特征,并通过优化传统图注意力网络中相关系数的计算方式,增强模型的特征提取能力。最后,利用条件随机场对文本进行解码,从而实现对实体的标注。实验结果表明,该模型相比CGN模型在MSRA、OntoNotes4.0、Weibo数据集上的F1值分别提升了0.67%、3.16%、0.16%,验证了其在中文命名实体识别任务上的有效性。 相似文献
14.
提出了一种基于图的人与物体的交互(Human-Object Interactions,HOIs)识别方法.为了对静态图像中人与物体间丰富的交互关系进行有效的表示,采用具有强大关系建模能力的图结构为图像生成对应的人-物交互关系图.为了对图像中上下文(context)信息加以利用,提出了引入注意力机制的特征处理网络(Fea... 相似文献
15.
知识图谱表示学习旨在将实体和关系映射到一个低维稠密的向量空间中。现有的大多数相关模型更注重于学习三元组的结构特征,忽略了三元组内的实体关系的语义信息特征和三元组外的实体描述信息特征,因此知识表达能力较差。针对以上问题,提出了一种融合多源信息的知识表示学习模型BAGAT。首先,结合知识图谱特征来构造三元组实体目标节点和邻居节点,并使用图注意力网络(GAT)聚合三元组结构的语义信息表示;然后,使用BERT词向量模型对实体描述信息进行嵌入表示;最后,将两种表示方法映射到同一个向量空间中进行联合知识表示学习。实验结果表明,BAGAT性能较其他模型有较大提升,在公共数据集FB15K-237链接预测任务的Hits@1与Hits@10指标上,与翻译模型TransE相比分别提升了25.9个百分点和22.0个百分点,与图神经网络模型KBGAT相比分别提升了1.8个百分点和3.5个百分点。可见,融合实体描述信息和三元组结构语义信息的多源信息表示方法可以获得更强的表示学习能力。 相似文献
16.
《计算机工程》2024,51(6)
在过去的一些研究中, 人工智能如何以一种分层的方式在多个抽象级别和多个时间尺度上表示感知和行动规划逐渐成为一个研究热点。受限于技术手段, 多数工作都局限在人工分解任务阶段, 如在三维装箱问题(3D-BPP)中, 通过启发式规则指导神经网络解析打包点帮助智能体分解状态空间, 将原本庞大、复杂的空间转换为一个个子空间, 为神经网络提供更好的备选解决方案。然而这种方式受限于规则本身, 若规则不能完美地拆解问题, 则这种固定规则的辅助会限制神经网络的性能, 使得更好的解决方案被规则本身忽略。针对这种情况, 提出一种基于启发式规则融合策略的改进装箱配置树(PCT)模型, 通过分层强化学习的思想将问题分层, 引入图注意力分类模型来判断在当前情况下最优的空间点拓展方案, 由此为拆解箱体内部空间点与探寻可行性位置提供更多的排列组合方式。实验结果表明, 基于启发式规则融合策略的改进模型在多个数据集上表现优于原始模型, 在包含额外密度信息的数据集中平均装箱利用率高达77.2%, 较原始模型提升1.7百分点, 能够在合理的时间内给出性能更优的解决方案。 相似文献
17.
《计算机工程》2025,51(6)
在过去的一些研究中, 人工智能如何以一种分层的方式在多个抽象级别和多个时间尺度上表示感知和行动规划逐渐成为一个研究热点。受限于技术手段, 多数工作都局限在人工分解任务阶段, 如在三维装箱问题(3D-BPP)中, 通过启发式规则指导神经网络解析打包点帮助智能体分解状态空间, 将原本庞大、复杂的空间转换为一个个子空间, 为神经网络提供更好的备选解决方案。然而这种方式受限于规则本身, 若规则不能完美地拆解问题, 则这种固定规则的辅助会限制神经网络的性能, 使得更好的解决方案被规则本身忽略。针对这种情况, 提出一种基于启发式规则融合策略的改进装箱配置树(PCT)模型, 通过分层强化学习的思想将问题分层, 引入图注意力分类模型来判断在当前情况下最优的空间点拓展方案, 由此为拆解箱体内部空间点与探寻可行性位置提供更多的排列组合方式。实验结果表明, 基于启发式规则融合策略的改进模型在多个数据集上表现优于原始模型, 在包含额外密度信息的数据集中平均装箱利用率高达77.2%, 较原始模型提升1.7百分点, 能够在合理的时间内给出性能更优的解决方案。 相似文献
18.
针对社交媒体平台上消息内容普遍很短、传播结构中存在大量空转发、用户角色与内容间的失配等条件约束,提出了一种基于传播网络中的用户属性信息和消息内容的谣言检测模型GMB_GMU。首先以用户属性为节点、传播链为边构建用户传播网络,并引入图注意力网络(GAT)得到用户属性的增强表示;同时,基于此用户传播网络,利用node2vec得到用户的结构表征,并使用互注意机制对其进行增强。另外,引入BERT建立源帖内容表征。最后,利用多模态门控单元(GMU)对用户属性表征、结构表征和源帖内容表征进行融合,从而得到消息的最终表征。实验结果表明,GMB_GMU模型在公开的Weibo数据上的准确率达到0.952,能够有效识别谣言事件,效果明显优于基于循环神经网络(RNN)和其他神经网络基准模型的传播算法。 相似文献
19.
20.
点击率预估是推荐系统中的核心任务,其关键是学习有效的特征交互,但现有基于深度神经网络的点击率预估方法未考虑冷启动问题,导致准确率降低。结合特征信息和域信息的嵌入,提出一种特征交互的点击率预估方法FF-GNN。利用基于图神经网络的交互模块分别提取特征嵌入和域嵌入的结构信息,建模细粒度的特征交互和粗粒度的域交互过程。同时通过设计图神经网络的权重计算模块,交叉引用特征图神经网络和域图神经网络的低阶特征信息,实现特征交互和个性化建模域交互。在此基础上,采用注意力机制融合特征交互和域交互模块的结果预测点击率。在Criteo和Frappe公开数据集上的实验结果验证了FF-GNN方法的有效性,其AUC指标相较于同类型Fi-GNN方法分别提高0.57和0.85个百分点,能够同时关注特征和域信息,提高点击率预估的准确度。 相似文献