首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
越来越多的证据表明microRNAs(miRNAs)在生命进程中发挥着重要作用。近年来,预测miRNAs与疾病的关联关系成为一个研究热点。然而,现有的方法大多数是基于已知的miRNA-疾病关联,对没有任何关联信息的miRNA或疾病的效果是很不理想的。本文提出了一种矩阵分解的方法LMFMDA(least squares optimization matrix factorization method for mirna-disease association)对miRNAs和疾病的关联关系进行预测。LMFMDA基于miRNAs相似度矩阵、疾病相似度矩阵和miRNAs-疾病关联关系矩阵,用迭代最小二乘法求解miRNAs和疾病的表达向量,最终利用miRNAs和疾病的表达向量完成对miRNA与疾病关联关系的预测。与常规做法不同的是,我们引入了辅助的miRNAs和疾病变量,来保证在优化时能够收敛到最优解。实验结果表明,采用留一交叉验证法得到的AUC值可达0.820 6,明显优于当前其他方法,尤其在没有任何关联信息的miRNA和疾病上,LMFMDA算法比最新的算法有了极大的提升。  相似文献   

2.
刘丹  赵森  颜志良  赵静  王会青 《计算机科学》2021,48(10):114-120
作为一类小的非编码RNA,miRNA的异常调控与人类疾病的发生和发展密切相关,研究miRNA与疾病的关联对于了解人类疾病致病机制具有重要意义.机器学习方法被广泛应用于miRNA-疾病关联预测,然而现有方法仅仅考虑了miRNA与疾病相似性网络信息,忽略了相似性网络的拓扑结构.因此,文中提出基于堆叠自动编码器的miRNA-疾病关联预测模型SAEMDA,该模型采用重启随机游走获取miRNA与疾病相似性网络的拓扑结构特征,用堆叠自动编码器提取miRNA与疾病的抽象低维特征,将得到的低维特征输入深度神经网络进行miRNA-疾病关联预测.SAEMDA模型在5折交叉验证中取得了较好的结果,并在结肠癌和肺癌两个案例中进行了验证.在结肠癌的案例中,此模型预测的前50个miRNA-疾病关联中的45个miRNA在数据库中得到了验证;在肺癌的案例中,排名前50的miRNA均在数据库中得到了验证.  相似文献   

3.
针对miRNA-疾病关联研究中信息使用不充分、过于依赖网络中节点的相似度信息以及预测准确度较低的问题,提出一种基于网络表示学习的miRNA-疾病关联预测方法(network representation learning miRNA-disease association,NRLMDA)。该方法通过引入长链非编码RNA(lncRNA)构造出miRNA-lncRNA-疾病异构网络,丰富原有网络的生物学信息;采用网络表征学习node2vec算法在上述提出的异构网络中以一定的游走策略获得节点的近邻序列,并通过skip-gram模型进行深度学习,从而获得节点的低维特征向量;最后基于miRNA-miRNA相似性的关联规则推断方法预测miRNA与疾病的关联。该方法能够挖掘出全局网络的拓扑结构特征,并且不需要负样本。NRLMDA在留一交叉验证和五折交叉验证以及进一步的案例研究上的实验结果优于经典方法。  相似文献   

4.
聚类分析是数据挖掘中一种非常重要的技术.聚类算法中的关键问题是相异度或相似度的度量,聚类结果直接依赖于相异度或相似度度量,尤其对于谱聚类方法更是如此.谱聚类算法是近期兴起的一种基于相似度矩阵的聚类算法.相比于传统的划分型聚类算法,谱聚类算法不受限于球状聚类簇,能够发现不规则形状的聚类簇.在已有的谱聚类算法中,高斯核相似度是最常用的相似度度量准则.基于高斯核相似度度量及其扩展形式,提出了一种加权的自适应的相似度度量,此相似度可以用于谱聚类以及其他基于相似度矩阵的聚类算法.新的相似度度量不仅能够描述多密度聚类簇中数据点间的相似度,而且可以降低离群点(噪声点)与其他数据点间的相似度.实验结果显示新的相似度度量可以更好地描述不同类型的数据集中数据点间的相似度,进而得到更好的聚类结果.  相似文献   

5.
目前,脑网络分类是研究热点,研究者采用不同的方法从标签数据中提取并选择特征,以实现对数据的自动分类,但是从大量的标签数据中提取和选择最优的特征很费时。针对以上问题,提出一种脑网络相似度计算方法并构建基于无偏脑网络的聚类模型。首先,使用余弦相似度和子网络核来度量脑网络的属性相似度和结构相似度,然后将结构相似度和属性相似度集成为一个相似度矩阵,最后利用谱聚类实现脑网络聚类。对openfMRI数据库中的50名精神分裂症患者与49名正常对照组进行了聚类测试,结果显示,Rand指数为0.91,精确率为0.86,召回率为0.98,F1为0.92。研究表明提出的模型能较准确地计算脑网络相似性,表现出较高聚类性能。  相似文献   

6.
提出一种基于词项关联关系与归一化割加权非负矩阵分解的微博用户兴趣模型构建方法.该方法首先基于词分布上下文语义相关性来建立词项关联关系矩阵刻画词项间相似度,然后应用归一化割加权非负矩阵分解算法获取用户—主题矩阵,产生用户感兴趣的微博主题聚类结果.实验表明,此方法能有效地进行微博主题聚类,并支持微博用户兴趣模型构建.  相似文献   

7.
Web服务的聚类能够改善基于服务的应用如服务发现、组合和QoS预测等.然而目前的聚类方法在相似度度量和信息预处理方面存在一些不足.提出Web服务的QoS和功能两种相似度模型,从不同角度度量服务间的相似度.在此基础上,提出一种特殊的考虑到编程风格和命名规则的预处理方法.最后结合SCAN算法实现了本方法并设计了对比实验对提出的方法进行验证.实验结果表明提出的模型和方法能够有效地提高Web服务的聚类效果.  相似文献   

8.
基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计,以期缓解关联数据稀疏和PU问题的影响。然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,与目前流行的基因-疾病关联预测方法相比,所提出的模型在查全率和查准率上均有显著提高,同时也能解决关联预测中常见的冷启动问题。  相似文献   

9.
随着网络技术不断飞速发展,人们的信息需求也随之增长.用户不再满足基于关键字的检索,而是希望网络能够实现以用户所关心的信息为中心、以用户需求为导向,将所有与中心相关的信息全部汇聚起来,也就是实现语义关联聚焦服务.所以针对语义关联聚焦服务需求,提出构建一种包含语义关联关系的语义覆盖网的方法,即首先将网络节点按照语义相似度组织成聚类,然后计算节点的语义关联度,最后根据语义关联度在聚类之间添加关联链接,最终形成各网络节点的关联语义覆盖网络.  相似文献   

10.
当前用户网络关系分析主要是研究用户之间的关联关系或群体关系,对于网络中用户与群体之间关联关系的研究相对较少。鉴于移动通信网络用户之间存在多样的特征关联,用户与群体之间也存在多样的关联关系。基于移动通信网络中具有一定通信相关性和位置规律相似性的特定群体,将位置预测引入位置项相关性度量,建立用户位置轨迹相关性度量标准,并提出了特定群体位置关联用户挖掘算法。仿真结果表明,所提出的方法能够实现对用户与群体之间关联关系的度量,能够利用位置相关性发现与特定群体具有潜在关联的用户。  相似文献   

11.
MicroRNAs (miRNAs) exert an enormous influence on cell differentiation,biological development and the onset of diseases.Because predicting potential miRNA-disease associations (MDAs) by biological experiments usually requires considerable time and money,a growing number of researchers are working on developing computational methods to predict MDAs.High accuracy is critical for prediction.To date,many algorithms have been proposed to infer novel MDAs.However,they may still have some drawbacks.In this paper,a logistic weighted profile-based bi-random walk method (LWBRW)is designed to infer potential MDAs based on known MDAs.In this method,three networks (i.e.,a miRNA functional similarity network,a disease semantic similarity network and a known MDA network) are constructed first.In the process of building the miRNA network and the disease network,Gaussian interaction profile (GIP) kernel is computed to increase the kernel similarities,and the logistic function is used to extract valuable information and protect known MDAs.Next,the known MDA matrix is preprocessed by the weighted K-nearest known neighbours (WKNKN) method to reduce the number of false negatives.Then,the LWBRW method is applied to infer novel MDAs by bi-randomly walking on the miRNA network and the disease network.Finally,the predictive ability of the LWBRW method is confirmed by the average AUC of 0.9393 (0.0061) in 5-fold cross-validation (CV) and the AUC value of 0.9763 in leave-one-out cross-validation (LOOCV).In addition,case studies also show the outstanding ability of the LWBRW method to explore potential MDAs.  相似文献   

12.
郭梦洁  熊贇 《计算机工程》2021,47(6):299-304
分析疾病与基因、miRNA等生物实体之间的关联是生物研究领域的重要目标,然而利用海量的数据进行生物学实验成本过高。提出一种基于网络表示学习的关联预测算法,通过多源数据集构建生物异质网络,并给出基于生成式对抗网络的异质网络表示学习算法学习鲁棒的向量表示,算法中的判别器和生成器考虑网络中的关系来捕获丰富的异质语义信息,并通过对抗学习进行训练,在此基础上通过衡量实体向量的相似性预测疾病和基因、miRNA之间的关联。实验结果表明,与HSSVM、GAN等算法相比,该算法在两个关联预测任务上均取得了最高的AUC值,具有更好的预测结果,并且通过引入更多异质数据进行训练,有效提升了算法性能。  相似文献   

13.
现实世界存在大量二分网络,研究二分社区结构有助于从新角度认识和理解复杂网络。由于二分网络特殊的二分结构,使得基于单模网络的现有社区发现算法无法适用。本文提出一种基于Kullback-Leibler距离的二分网络社区发现算法,该算法将异质节点间的连接关系转化为其在用户节点集上的连接概率分布,并建立基于概率分布的KL相似度衡量节点连接模式的差异性,从而克服二分结构对节点相似性评估的不利影响,实现对二分网络异质节点的社区发现。在人工网络和真实网络上的实验和分析表明:该算法能够有效挖掘二分网络社区结构,改善二分网络社区发现的准确性和效率。  相似文献   

14.
针对大规模数据集减法聚类时间复杂度高的问题,提出一种基于Nyst(o)m密度值逼近的减法聚类方法.特别适用于大规模数据集的减法聚类问题,可极大程度降低减法聚类的时间复杂度.基于Nystr(o)m逼近理论,结合经典减法聚类样本密度值计算的特点,巧妙地将Nystr(o)m理论用于减法聚类未采样样本之间密度权值矩阵的逼近,从而实现了对所有样本的密度值逼近,最后沿用经典减法聚类修正样本密度值的方法,实现整个减法聚类过程.将本文算法在人工数据、标准彩色图像及UCI数据集上进行了实验,详细说明了本文算法利用少数采样样本逼近多数未采样样本密度权值、密度值以及进行减法聚类的详细过程,并给出了聚类准确率、耗时及算法性能加速比.实验结果表明,与经典的减法聚类相比,本文算法在不影响聚类结果的情况下,对于较大规模数据集,可显著降低减法聚类的时间复杂度,极大程度地提高减法聚类的实时性能.  相似文献   

15.
Rapidly identifying protein complexes is significant to elucidate the mechanisms of macromolecular interactions and to further investigate the overlapping clinical manifestations of diseases.To date,existing computational methods majorly focus on developing unsupervised graph clustering algorithms,sometimes in combination with prior biological insights,to detect protein complexes from protein-protein interaction(PPI)networks.However,the outputs of these methods are potentially structural or functional modules within PPI networks.These modules do not necessarily correspond to the actual protein complexes that are formed via spatiotemporal aggregation of subunits.In this study,we propose a computational framework that combines supervised learning and dense subgraphs discovery to predict protein complexes.The proposed framework consists of two steps.The first step reconstructs genome-scale protein co-complex networks via training a supervised learning model of l2-regularized logistic regression on experimentally derived co-complexed protein pairs;and the second step infers hierarchical and balanced clusters as complexes from the co-complex networks via effective but computationally intensive k-clique graph clustering method or efficient maximum modularity clustering(MMC)algorithm.Empirical studies of cross validation and independent test show that both steps achieve encouraging performance.The proposed framework is fundamentally novel and excels over existing methods in that the complexes inferred from protein co-complex networks are more biologically relevant than those inferred from PPI networks,providing a new avenue for identifying novel protein complexes.  相似文献   

16.
针对大规模数据集减法聚类时间复杂度高的问题,提出一种基于Nyström密度值逼近的减法聚类方法。特别适用于大规模数据集的减法聚类问题,可极大程度降低减法聚类的时间复杂度。基于Nyström逼近理论,结合经典减法聚类样本密度值计算的特点,巧妙地将Nyström理论用于减法聚类未采样样本之间密度权值矩阵的逼近,从而实现了对所有样本的密度值逼近,最后沿用经典减法聚类修正样本密度值的方法,实现整个减法聚类过程。将本文算法在人工数据、标准彩色图像及UCI数据集上进行了实验,详细说明了本文算法利用少数采样样本逼近多数未采样样本密度权值、密度值以及进行减法聚类的详细过程,并给出了聚类准确率、耗时及算法性能加速比。实验结果表明,与经典的减法聚类相比,本文算法在不影响聚类结果的情况下,对于较大规模数据集,可显著降低减法聚类的时间复杂度,极大程度地提高减法聚类的实时性能。  相似文献   

17.
链接预测是确定用户间关系的基本工具。通过相似性度量进行链路预测是一种常见的方法,提出一种基于相似度的链路预测算法,根据网络结构及拓扑特性来确定相似度,引入优化链路预测度量方法,将聚类系数作为网络结构性质。此外,并考虑共享邻域,得到较其他同类链路预测方法更好的性能。实验结果表明,提出的算法性能优于经典算法。结合在Facebook、Twitter与新浪微博等社交网络环境中的实验结果可知,SLP-CNP法较其他算法具有更优精度与效率。在未来的工作中,还可尝试在所提方法的基础上,提升在加权网络、有向网络和二部网络中的适用性。  相似文献   

18.
Classical feature extraction and data projection methods have been well studied in the pattern recognition and exploratory data analysis literature. We propose a number of networks and learning algorithms which provide new or alternative tools for feature extraction and data projection. These networks include a network (SAMANN) for J.W. Sammon's (1969) nonlinear projection, a linear discriminant analysis (LDA) network, a nonlinear discriminant analysis (NDA) network, and a network for nonlinear projection (NP-SOM) based on Kohonen's self-organizing map. A common attribute of these networks is that they all employ adaptive learning algorithms which makes them suitable in some environments where the distribution of patterns in feature space changes with respect to time. The availability of these networks also facilitates hardware implementation of well-known classical feature extraction and projection approaches. Moreover, the SAMANN network offers the generalization ability of projecting new data, which is not present in the original Sammon's projection algorithm; the NDA method and NP-SOM network provide new powerful approaches for visualizing high dimensional data. We evaluate five representative neural networks for feature extraction and data projection based on a visual judgement of the two-dimensional projection maps and three quantitative criteria on eight data sets with various properties.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号