首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
越来越多的证据表明microRNAs(miRNAs)在生命进程中发挥着重要作用。近年来,预测miRNAs与疾病的关联关系成为一个研究热点。然而,现有的方法大多数是基于已知的miRNA-疾病关联,对没有任何关联信息的miRNA或疾病的效果是很不理想的。本文提出了一种矩阵分解的方法LMFMDA(least squares optimization matrix factorization method for mirna-disease association)对miRNAs和疾病的关联关系进行预测。LMFMDA基于miRNAs相似度矩阵、疾病相似度矩阵和miRNAs-疾病关联关系矩阵,用迭代最小二乘法求解miRNAs和疾病的表达向量,最终利用miRNAs和疾病的表达向量完成对miRNA与疾病关联关系的预测。与常规做法不同的是,我们引入了辅助的miRNAs和疾病变量,来保证在优化时能够收敛到最优解。实验结果表明,采用留一交叉验证法得到的AUC值可达0.820 6,明显优于当前其他方法,尤其在没有任何关联信息的miRNA和疾病上,LMFMDA算法比最新的算法有了极大的提升。  相似文献   

2.
郭梦洁  熊贇 《计算机工程》2021,47(6):299-304
分析疾病与基因、miRNA等生物实体之间的关联是生物研究领域的重要目标,然而利用海量的数据进行生物学实验成本过高.提出一种基于网络表示学习的关联预测算法,通过多源数据集构建生物异质网络,并给出基于生成式对抗网络的异质网络表示学习算法学习鲁棒的向量表示,算法中的判别器和生成器考虑网络中的关系来捕获丰富的异质语义信息,并通...  相似文献   

3.
K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。  相似文献   

4.
环状RNA (circluar RNA,circRNA)在基因表达、剪切和转录的过程中扮演着重要角色.越来越多的证据表明,circRNA与疾病的产生与发展存在着重要的联系.本文提出了一种基于多数据融合的非负矩阵分解算法(EDNMF)预测circRNA-疾病关联关系.该方法首先对circRNA-疾病关联关系进行预处理,解...  相似文献   

5.
针对某高校信息工程学院学生的学习状况和培养方案的改进需求,以2008-2014级信息工程学院本科生课程成绩为研究对象,提出一种基于改进K-means和引入兴趣度的Apriori的学生课程成绩分析方法。采用改进的K-means算法对成绩信息进行离散化处理,采用引入兴趣度的Apriori算法进行挖掘并根据得到的课程之间的关联规则绘制课程关系网络图,对课程间的关联关系、衔接关系以及课程的重要程度进行分析。应用所述方法进行挖掘能够减少大量没有意义的规则,提高了挖掘结果的准确性,挖掘所得到的结果不仅能够为教学方案的设计和改进提供一定的参考信息,还有助于提高学校的教学质量和学生的学习质量。  相似文献   

6.
基因-疾病关联关系预测已经成为当前生物医学研究的一个热点。现有的关联预测方法通常会遭受基因-疾病关联数据稀疏和PU(positive and unlabeled)问题的影响。基于以上不足,提出一种基于Katz增强归纳型矩阵补全的基因-疾病关联预测模型。该模型由基于Katz方法的预估计和基于归纳型矩阵补全方法的精化估计两个步骤组成。具体地,先利用Katz方法基于基因-疾病异构网络对基因-疾病关联进行预估计,以期缓解关联数据稀疏和PU问题的影响。然而,受制于相似度网络的质量,Katz方法在预估计基因-疾病关联时不可避免地会引入一些噪声,为此,将弹性网正则化技术引入传统的归纳型矩阵补全模型以增强其鲁棒性,进而用改进的归纳型矩阵补全模型来精化基因-疾病关联预测效果。实验结果表明,与目前流行的基因-疾病关联预测方法相比,所提出的模型在查全率和查准率上均有显著提高,同时也能解决关联预测中常见的冷启动问题。  相似文献   

7.
加权复杂网络中的权重主要表示节点与节点之间的相互作用强度。由于权重的存在,传统的基于局部结构的无权链接预测方法并不适用于加权网络。因此一部分工作尝试把传统的基于局部邻接节点结构的算法迁移到加权网络场景,但是该类算法只是利用了一级共邻节点的拓扑属性,无法反映共邻节点的邻居对潜在节点对的贡献以及共邻节点互联密集程度对预测结果的影响。该文从局部结构的密集层面来分析共邻节点对潜在节点对的影响,提出了一种集成加权聚类系数的相似度指标(WCCLP),该指标能够有效地扩大局部共邻节点结构对预测性能的影响,同时也能轻易拓展到加权局部朴素贝叶斯链接预测模型(WLNB)中。采用无监督学习的实验表明,和现有的相似度算法相比,WCCLP在多个真实数据集取得了更好的预测效果,同时在有监督学习的链接预测场景中,由WCCLP构建的特征比现有的局部相似度算法构成的特征更具判别性,同时拓展到WLNB的实验效果证明加权聚类系数的定义能够有效推广到其他模型当中。  相似文献   

8.
协同过滤算法在个性化推荐系统中应用广泛,为保证其在用户规模扩大的同时可以保持推荐的高效性和准确性,设计了一种基于PCA降维和二分K-means聚类的协同过滤推荐算法PK-CF。该算法为解决用户-项目评分矩阵极度稀疏造成的相似度计算误差的问题,采用主成分分析法对用户-项目评分矩阵进行降维,去除含信息量少的维度,只保留最能代表用户特征的维度;为解决协同过滤算法在系统规模庞大情况下的相似度计算时耗问题,通过在降维后的低维向量空间上进行二分K-means聚类来减小目标用户最近邻的搜索范围。在MovieLens数据集上对传统协同过滤算法、基于K-means聚类的协同过滤算法及PK-CF算法进行性能测试的结果表明:PK-CF算法不仅能有效地提高推荐结果的准确率与召回率,而且具有较高的时间效率。  相似文献   

9.
为了解决用户在室内定位中,依靠WiFi指纹定位存在精度不高、误差偏大的问题,提出一种基于改进二分K-means聚类算法的室内定位方法。通过层次聚类的思想对二分K-means聚类算法(BKM)进行改进,解决了BKM聚类算法需要提前确定聚类中心、导致指纹定位中聚类结果受初始聚类个数影响的缺陷,并结合变色龙算法(Chameleon),将部分划分过细的簇合并,优化定位指纹库的可靠性。仿真实验结果表明所提出的方法有效降低了计算复杂度,提高了定位精度。此外,该方法与目前常用的BKM聚类算法相比,具有更好的聚类效果和定位精度。  相似文献   

10.
网络节点预测研究目前主要集中在源头节点和隐藏节点预测方面,缺少新生节点预测方向的研究。以论文和关键词关系网为研究对象,利用关键词组合情况预测新论文的产生,开展新生节点预测研究。首先将论文—关键词二分网络加权投影成关键词关系网络,然后利用关键词组合在未来出现的可能性预测新论文的产生。计算这种可能性需考虑两方面影响:一种是相似性,表示关键词共同出现的倾向;一种是互斥性,描述关键词彼此排斥的倾向,如内涵高度一致的两个关键词极少同时出现。采集期刊的论文和关键词信息构建数据集,对提出的论文预测算法进行验证,并与已有算法作对比,结果显示该算法预测效果更好。  相似文献   

11.
Circular RNAs (circRNAs) are RNAs with a special closed loop structure,which play important roles in tumors and other diseases.Due to the time consumption of biological experiments,computational methods for predicting associations between circRNAs and diseases become a better choice.Taking the limited number of verified circRNA-disease associations into account,we propose a method named CDWBMS,which integrates a small number of verified circRNA-disease associations with a plenty of circRNA information to discover the novel circRNA-disease associations.CDWBMS adopts an improved weighted biased meta-structure search algorithm on a heterogeneous network to predict associations between circRNAs and diseases.In terms of leave-one-out-cross-validation (LOOCV),10-fold cross-validation and 5-fold cross-validation,CDWBMS yields the area under the receiver operating characteristic curve (AUC) values of 0.9216,0.9172 and 0.9005,respectively.Furthermore,case studies show that CDWBMS can predict unknow circRNA-disease associations.In conclusion,CDWBMS is an effective method for exploring disease-related circRNAs.  相似文献   

12.
一种用于网络安全系统的报警聚类与关联模型   总被引:3,自引:0,他引:3       下载免费PDF全文
针对网络安全系统中普遍存在大量冗余报警的问题,本文提出一种新型报警处理模型。该模型通过相似性评估方法和分层机制对报警信息进行聚类,有效地减少了报警信息量;同时通过关联分析技术挖掘报警信息之间的潜在关联并生成新的规则,增强了识别未知攻击的能力,提高了聚类效率。  相似文献   

13.
基于数值属性的关联规则挖掘算法   总被引:7,自引:0,他引:7  
关联规则的挖掘是一个重要的数据挖掘问题。目前的算法主要是研究支持—信任框架理论的关联规则挖掘,基于支持—信任理论的关联规则挖掘布尔型描述的数据已经比较成熟,但是现实的数据库中有许多数值属性的数据,从这些数据中挖掘潜在的规则,经典的关联规则方法(Apriori)就显得力不从心了。这里介绍将数值数据映射到二维空间,利用基于密度分布函数的聚类分析方法将数值属性区间分段,并在此基础上挖掘容易理解并且具有概括性和有效的数值属性关联规则。  相似文献   

14.
发掘多值属性的关联规则   总被引:45,自引:1,他引:45  
张朝晖  陆玉昌  张钹 《软件学报》1998,9(11):801-805
属性值可以取布尔量或多值量.从以布尔量描述的数据中发掘关联规则已经有比较成熟的系统和方法,而对于多值量则不然.将多值量的数据转化为布尔型的数据是一条方便、有效的途径.提出一种算法,根据数据本身的情况决定多值量的划分,进而将划分后的区段映射为布尔量,在此基础上可发掘容易理解且具有概括性的、有效的关联规则.  相似文献   

15.
在分析了经典的LEACH分簇路由算法,以及基于LEACH算法基础上的几种经典的改进算法后,针对小规模无线测距网络的特点,在传输数据量较少、簇首节点无需进行大量数据融合的情况下,对LEACH算法进行改进,增加了节点与基站直接通信的个数,减少了多跳累加误差对测距的影响.使用MATLAB软件进行仿真,理论与实验仿真表明,本文...  相似文献   

16.
回顾了当前入侵检测技术和数据挖掘技术,分析了Snort网络入侵检测系统存在的问题,重点研究了数据挖掘中的关联算法Apriori算法和聚类算法K一均值算法;在Snort入侵检测系统的基础上,增加了正常行为挖掘模块、异常检测模块和新规则生成模块,构建了基于数据挖掘技术的网络入侵检测系统模型。新模型能够有效地检测新的入侵行为,而且提高了系统的检测效率。  相似文献   

17.
孙凯  艾丽蓉 《计算机工程》2012,38(16):267-269
传统二部图投影和排序(BGPR)算法的推荐精度不高。为此,提出一种基于项目属性和项目度的BGPR算法。分析二部图投影和随机游走的特点,引入项目属性和项目度2个影响因子,通过对初始化向量和项目相似性的优化,设计个性化推荐算法。实验结果表明,该算法的推荐精度较高。  相似文献   

18.
基于数据对象间的关联限制定义了类间关联系数,本文提出了两阶段的限制层次聚类算法TCCL.算法分为两个阶段,第一阶段主要依据数据对象的自然分布,基于数据对象间的距离把它们合并入一个个小类;在第二阶段,依据背景知识,基于类间关联系数来实现小类的进一步合并.一些实际数据集的实验结果表明,TCCL可以比较有效地利用所给关联限制来改善聚类效果.  相似文献   

19.
杨苹  吕茵  黄锦成 《计算机工程》2011,37(13):259-261
根据无线网络业务数据的特点,提出一种基于模糊聚类的数据填补算法。该算法考虑数据的周期性特点,并运用沉积的历史数据,对数据进行聚类分析得出标准模板,采用标准模板对缺失数据进行填补。利用该算法对小区小时话务量数据进行填补。实验结果表明,该算法平均误差率较小,无偏性较好,在数据缺失较为严重的情况下也能完成填补。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号