首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
旧药新用是应对突发疾病的有效手段。利用计算技术筛选潜在的药物-靶标关联,有利于快速发现治疗疾病的候选药物。基于Matlab语言设计了一款药物-靶标预测平台,在标准数据集上运用网络一致性投影方法预测,分析了余弦相似性计算、高斯内核相似性计算及Logistic变换对预测结果的影响,实验结果证实了平台的有效性。  相似文献   

2.
本文报告一种新颖的基于骨架结构分类法的递进式药物筛选(PS-SCA)技术。此技术在美国国立癌症研究所(NCI)的八组细胞水平上的高通量筛选实验数据上进行了测试,结果表明,基于拓扑结构数据的递进式筛选可以极大地降低药物筛选的代价,缩短筛选时间。模拟实验证明,PS-SCA递进式筛选技术包括三个阶段:(1)骨架多样性采样筛选试验:(2)活性化合物发现试验;(3)可忽略的多余筛选试验。运用PS-SCA递进式筛选技术,可以在只筛选20%的化合物情况下找到最有意义的70-80%的活性化合物。而且,这70%-80%的活性化合物中包含了关键的结构骨架。  相似文献   

3.
协同过滤算法应用于个性化推荐系统中取得了巨大成功,它是通过用户项目评分数据,以用户之间或者项目之间相互协作的方式来产生推荐。然而,邻居用户的相似度计算不精确一直是阻碍推荐系统推荐精度进一步提高的主要因素。从提高用户间相似度计算精度出发,提出了一种改进算法,该算法通过考虑不同特征、加强平均值影响、惩罚热门项目的比重,对用户的相似度计算方法进行改进,以期生成更加合理的邻居用户集,最后,根据评分预测公式进行预测,最终产生推荐。在MovieLens数据集上的实验表明,改进算法计算用户间的相似度更加精确,推荐算法的预测精确度有了显著提高。  相似文献   

4.
随着高通量技术的快速发展,越来越多的多组学数据被收集、分析,并对慢性精神疾病,即精神分裂症进行分类。现有几种基于多任务的学习模型将每组的特征学习看作一个任务,但大多数模型都忽略了多组数据之间固有的结构信息,而这些信息在识别特征提取中可能具有重要作用。文中利用多组学数据联合学习的内在关联,通过随机森林策略计算样本之间的相似度,结合L21-范数(组稀疏)正则化器强制联合选择一些共同的特点,以保持单组数据之间和多组数据之间的结构信息,提出一种多重正则化多任务学习模型进行多组学数据融合的分类任务。实验部分采用单核苷酸多态性(SNP)、功能性磁共振成像(fMRI)和DNA甲基化三组数据作为模型真实数据的输入,通过10折交叉验证法划分训练集与测试集并进行参数训练,分别在模拟数据集与真实数据集上进行测试,并与其他现有方法做比较。实验结果表明,该模型具有较强的鲁棒性,分类精度达到86.07%。  相似文献   

5.
基于片段的药物设计(Fragment-Based Drug Design,FBDD)是药物研发的主流方法之一。如何高效从海量药物大数据中筛选出具有相似分子片段的药物小分子成为生物化学研究领域的挑战性问题。针对目前人工筛选耗时长、效率低、药物筛选周期长等问题,提出一种基于2D模型的药物小分子筛选方法(SMS-2D)。利用计算机自动化筛选出与目标分子片段具有相似片段的药物小分子。实验结果表明:SMS-2D方法能高效地筛选出包含与分子片段具有相似片段的小分子。  相似文献   

6.
随着下一代高通量DNA测序的快速发展,RNA-Seq测序已成为转录组学分析的标准技术。在处理多样本RNA-Seq数据时,现有表达水平估计方法通常基于单个样本逐个处理,忽略了基因读段分布在样本间高度相似的特点。因此,提出了一个基于多样本RNA-Seq数据的表达水平估计方法,称为MRSeq。其关键是通过建立偏差曲线估计模型获得基因读段分布在样本之间的共享特征,通过偏差权重将共享特征嵌入到模型中,用来修正读段数据,同时通过增加稀疏约束来表现基因和异构体表达水平之间的稀疏性。进而将该模型应用到多个真实数据集进行评测,与目前主流方法的比较结果表明:MRSeq不仅能得到准确的基因和异构体表达水平,同时也获得了更有意义的生物解释。  相似文献   

7.
药物-靶标作用关系预测在药物研发以及药物重定位中扮演着重要角色,但现有的机器学习方法在正负样本高度不平衡的数据上仍存在预测能力不足的问题.为此,提出一种基于图卷积神经网络的药物靶标作用关系预测方法.该方法首先构造一个结合多种药物(靶标)相关信息的异质信息网络,然后采用图卷积神经网络在此异质信息网络上学习得到能精确表达每个节点拓扑特征及邻居特征信息的低维向量表征,最后利用这些向量信息通过向量空间投影预测节点间概率的评分.在DrugBank_FDA和Yammanishi_08数据集上进行的药物-靶标作用关系预测的对比实验中,所提方法的AUPR(Area Under the Precision-Recall Curve)值都优于其他4种方法,并且在较大型数据集上也有较好的表现.实验结果表明,所提方法提高了样本高度不平衡时的药物-靶标作用关系预测性能;同时在生物药物数据库上的实验也验证了所提方法所发现的未知药物-靶标作用关系的有效性.  相似文献   

8.
合成致死(Synthetic Lethality,SL)是一种负遗传相互作用,描述的是两个非必要基因之间的相互关系:其中任何一个基因的突变对细胞存活的影响很小,但两个基因的共同突变会导致细胞死亡或其他有碍细胞存活的表型.SL对于解释复杂生物过程、推动癌症的临床诊治有着重要的意义.因此,利用海量的高通量数据,通过构建数据分析模型和计算方法,从计算的角度进行SL对的挖掘和预测,是计算生物学研究的一个重要方向.本文首先对于SL预测所使用的相关数据进行了详细的综述,然后从生物网络这一全新视角出发,重点讨论了基于网络分析的SL预测方法.从网络上的统计学方法、基于网络结构变化的方法、基于网络特征学习的方法、基于图表示学习的方法四个方面综述了相关预测模型和研究的最新进展,详细地比较了各类方法的算法思路、应用场景和优缺点,最后针对SL预测的结果评估和验证方法的研究进展进行了论述.在此基础上,论文进一步总结出SL预测研究中所面临的几项挑战,并针对性的对未来发展方向进行展望,希望为今后的相关研究提供一些有用的参考和思路.  相似文献   

9.
张康  陈明  顾凡 《计算机应用研究》2023,(12):3643-3650
在段落重排序任务中,最近研究人员提出了基于双编码器的后期交互架构以实现快速计算。由于这些模型在训练和推理中都使用预训练模型对查询和段落进行独立编码,其排序性能较大地依赖了预训练模型的编码质量。此外,一些多向量的后期交互方式采用字符向量之间的最大相似度之和来计算文本相似度,容易出现部分匹配的问题。针对以上不足,提出了替换段落预测(RPP)的预训练方法,它采用一种部分连接的自编码器架构,使用ELECTRA类似的替换词汇预测任务来让预训练模型建立给定查询和文档之间的语义关系,从而增强其表示能力。在交互方式改进上,设计了一种新的后期交互范式。使用不同注意力引导待排序段落文本表征,通过动态融合后使用点积与查询向量进行相似度计算,具有较低的复杂度和较细的粒度特征。在MS MACRO段落检索数据集上的重排序实验表明:在不同训练条件下,该模型比ColBERT和PreTTR在MRR@10指标上都要优秀;在使用知识蒸馏情况下,性能接近教师模型的水平,且排序时间在GPU和CPU大幅缩短。  相似文献   

10.
针对基于协同过滤的药物重定位算法进行了研究,考虑到数据稀疏性对协同过滤算法的巨大影响,提出一种基于药物和疾病特征关联的药物重定位混合推荐算法。该算法不仅使用了药物和疾病关系数据,还利用了药物结构、靶蛋白、副作用以及药物—疾病特征矩阵等信息计算药物之间的相似性,降低了数据稀疏性对推荐效果的影响,提高了推荐精度。经过对比实验发现,该算法具备较好的推荐效果,并能够发掘具有潜在联系的药物—疾病组合,进一步验证了该算法可以有效地应用于药物重定位。  相似文献   

11.
基于序列的G蛋白偶联受体-药物相互作用预测研究   总被引:1,自引:0,他引:1  
丁林松  郑宇杰 《计算机科学》2015,42(8):75-77, 111
准确预测G蛋白质偶联受体(GPCR)是否与药物(Drug)相互作用是新药开发的关键步骤之一。从时间和费用方面来说,通过生物实验的方法来确定GPCR-Drug是否相互作用的代价是昂贵的。因此,直接从蛋白质序列出发预测GPCR-Drug的相互作用具有重要的意义。提出了一种基于序列的GPCR-Drug相互作用预测方法:从蛋白质序列抽取进化信息特征;对药物抽取指纹特征;基于上述两种特征,使用基于证据理论的K近邻算法进行分类预测。在标准数据集上的实验结果表明了所述方法的有效性。  相似文献   

12.
为发现金钗石斛潜在活性成分组,本研究从化合物的分子结构和生物活性入手进行计算模拟,通过对141个已知化合物的分子骨架进行结构相似度聚类,发现了11个结构相似的成分组,而大部分成分组具有明显的ADME活性。另一方面,结合靶点虚拟筛选和KEGG通路富集,构建并分析"化合物-靶点-通路"网络,预测金钗石斛的重要潜在活性成分和重要作用机制,揭示了5个成分组与特定生物功能间的相关性。潜在活性成分组的虚拟筛选为揭示金钗石斛药效物质基础提供了理论依据。  相似文献   

13.
基于邻域的协同过滤算法中,用户(项目)相似度的计算对预测和推荐结果有重要影响。传统相似度基于共同评分项目,能快速计算出相似度结果,但在稀疏数据下,推荐准确性较低。目前大多数改进的协同过滤算法通过制定较复杂的相似度公式,提高推荐准确性,但往往忽略了模型的计算时间。为达到在降低时间成本的同时执行有效的推荐,提出融合相似度和预筛选模式的协同过滤算法。首先在相似度模型中定义相对评分差异,并列举应满足的定性条件得到优化的相似度,同时考虑基于信息熵改进的评分偏好和用户全局评分的数量信息作为权重因子,更好地区分用户间差异,缓解稀疏数据下相似度计算不准确的问题。其次通过分析相似度模型和评分预测公式的隐式约束,提出预筛选模式,过滤掉大量无效的用户及对应的评分数据,进一步提高计算效率。最终通过融合相似度和预筛选模式得到协同过滤算法。在基准数据集上的实验表明,与其余8种算法相比,提出的算法具有良好的推荐质量和较高的时间效率。  相似文献   

14.
洪海燕  刘维 《计算机科学》2016,43(Z11):16-20, 25
关键蛋白质对于细胞生活是不可缺少的,识别关键蛋白质可以帮助了解细胞生活的最小需求,同时对药物设计也有非常大的作用。随着高通量技术的发展,人们可得到越来越多的蛋白质-蛋白质相互作用(PPI)的数据,这就使得可以在网络层次上来研究关键蛋白质。目前,学术界已经提出了一系列的计算方法来识别关键蛋白质,但这些方法并没有完全解决蛋白质相互作用数据的假阳性问题。除此之外,现有方法一般只考虑了网络的拓扑结构,对于生物信息的考虑,目前还是比较欠缺的。蛋白质对于人类细胞的生命活动不仅仅与网络拓扑结构有关,还和蛋白质在网络上的生物信息相关。因此,针对以上问题,提出了一种高效的预测关键蛋白质的新方法EPP(Essential Proteins Predict),该方法通过计算蛋白质在PPI网络中的重要性来进行预测,蛋白质的重要性越高,成为关键蛋白质的可能性就越大。取重要性排名前P%的蛋白质作为关键蛋白质,在进行蛋白质重要性的计算时,综合考虑语义相似度及可信度因素,以综合考虑网络的拓扑结构与蛋白质本身的生物信息。实验结果表明,与其他传统方法相比,提出的新方法复杂度较低,且能够识别出更多的关键蛋白质,并且其统计指标也高于其他的方法。  相似文献   

15.
在癌症研究中,随着高通量测序技术发展已经产生了海量的复杂数据。尽管有了一些利用深度学习和统计学方法进行多组学数据整合的研究,但目前仍缺乏较为有效率的整合方法。因此提出一种基于深度自编码器的多组学数据整合方法(deep autoencoder for multi-omics integration,DAEMI)。它利用自编码器中的瓶颈层,学习多组学数据的特征表示。与先前利用深度学习整合的研究相比,DAEMI可以发现明显生存差异的癌症亚型。同时因为不需要生存数据来选择特征,DAEMI可以使用更多特征进行K均值聚类,进而完成癌症分型任务。将DAEMI应用于模拟数据集与四个癌症数据集实验,通过与高阶路径相似度网络的融合模型(HOPES)、相似性网络融合(SNF)、iClusterPlus和moCluster进行比较,结合模拟数据集测试结果与真实癌症数据集测试结果来看,DAEMI要优于其他方法。相应的生物功能分析揭示,神经退行性疾病与线粒体功能障碍可能与癌症共享某些生物学通路。  相似文献   

16.
城市交通流量预测是构建绿色低碳、安全高效的智能交通系统的重要组成部分.时空图神经网络由于具有强大的时空数据表征能力,被广泛应用于城市交通流量预测.当前时空图神经网络在城市交通流量预测中仍存在以下两方面局限性:1)直接构建静态路网拓扑图对城市空间相关性进行表示,忽略了节点的动态交通模式,难以表达节点流量之间的时序相似性,无法捕获路网节点之间在时序上的动态关联.2)只考虑路网节点的局部空间相关性,忽略节点的全局空间相关性,无法建模交通路网中局部区域和全局空间之间的依赖关系.为打破上述局限性,本文提出了一种多视角融合的时空动态图卷积模型用于预测交通流量.首先,从静态空间拓扑和动态流量模式视角出发,构建路网空间结构图和动态流量关联图,并使用动态图卷积学习节点在两种视角下的特征,全面捕获城市路网中多元的空间相关性.其次,从局部视角和全局视角出发,计算路网的全局表示,将全局特征与局部特征融合,增强路网节点特征的表现力,发掘城市交通流量的整体结构特征.接下来,设计了局部卷积多头自注意力机制来获取交通数据的动态时间相关性,实现在多种时间窗口下的准确流量预测.最后,在四种真实交通数据上的实验结果证明了本文模型的有效性和准确性.  相似文献   

17.
本文提出1种新的筛选生物标记物的方法——分类特征变量法(CCV)。该法是在偏最小二乘法(PLS)的原理上,建立的统计学方法,不但包含判别函数的信息,而且兼顾分类潜变量的信息,在生物标记物筛选过程中表现出优势。本文不仅阐述了CCV法的原理和计算方法,还对实际代谢组数据体系的应用过程进行了详细描述。针对气相色谱-质谱联用仪(GC-MS)获得的鼻咽癌病人和健康人的血清代谢指纹图谱数据,采用该法筛选潜在的生物标记物。得到19个变量,分别对应13种内源性代谢物,并与载荷矢量图法筛选得到的代谢标记物的判别能力进行比较。以2种方法各自筛选出的特征变量为输入数据,用偏最小二乘-线性判别分析(PLS-DA)和交互检验(CV)分别验证其分类判别能力和预测能力。结果表明,CCV明显优于目前常用的载荷矢量图法,是1种新的快速有效的生物标记物筛选方法。  相似文献   

18.
物联网设备已经被广泛应用于各个领域,为保证物联网的安全,排除内部隐患,基于时序特征数据高效索引技术设计物联网感知设备安全自动监测方法。结合时序特征数据高效索引技术提取物联网信息特征,在报文传输过程的基础上,区分不同流量数据之间的差异、恶意攻击软件与感知设备的系统特征,计算样本数据的表征值,得到物联网感知设备的原始信息特征。对数据特征进行分类,计算其数据内的缺失值和错误值,得到特征向量的筛选优化结果,计算训练损失函数,调整实际操作的阈值,保证数据特征分类的准确性。搭建物联网感知设备监测模型,训练判别器,进行物联网的自动监测。分别对数据包、字节以及数据流量进行识别,该监测技术可以准确地区分良性数据与攻击数据,从而保证物联网感知设备的安全。  相似文献   

19.
赵一鉴  林利  王茜蒨  闻鹏  杨东 《计算机应用》2023,(11):3594-3598
目前基于相似度的移动目标轨迹预测算法一般根据数据的时空特性进行分类,无法体现算法自身的特点,为此提出一种基于算法特征的分类方法。轨迹相似度算法通常需要先计算两点之间的距离,再开展后续计算,而常用的欧氏距离(ED)只适用于目标在小区域范围内移动的问题。针对现有基于相似度的轨迹预测算法无法适用于移动范围比较大的海上目标轨迹预测的问题,提出使用大地距离代替ED进行相似度计算。首先,对轨迹数据进行预处理和分段;其次采用离散弗雷歇距离(FD)作为相似性度量;最后,利用模拟数据和实际数据进行测试。实验结果表明,当海上目标移动范围较大时,采用ED算法可能会得到不正确的预测结果,而所提算法可输出正确的目标轨迹预测结果。  相似文献   

20.
基于分子对接的药物虚拟筛选技术通过评估多个配体化合物与受体的结合强度来筛选最强结合的分子。在新冠病毒疫情全球蔓延形势下,超大规模快速药物虚拟筛选对于从海量配体结构中筛选出潜药分子至关重要。超级计算机的强大算力为药物虚拟筛选提供了硬件保障,但超大规模的药物虚拟筛选还面临着很多挑战,影响了计算的有效进行。在对挑战进行分析的基础上,提出了以中央数据库进行集中任务分发的方案,设计了多层级任务分发框架,并通过多层级智能调度、海量小分子文件多层级压缩处理、动态负载均衡、高容错管理等技术有效应对了面临的各种挑战,开发了简单易用的“树”形多层级任务分发系统,实现了快速高效稳定的药物虚拟筛选任务分发、计算和结果处理功能,计算效率近线性。在此基础上,采用异构计算技术在国产先进计算系统上针对新冠病毒两种不同活性位点快速完成了超过20亿化合物的药物虚拟筛选,为应对暴发性恶性传染病的超大规模快速虚拟筛选提供了强大计算保障。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号