首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
现有疾病基因预测方法大多利用致病基因的各类注释信息进行预测,但仍有很多疾病没有任何注释信息。针对该问题,提出一种基于文本挖掘与功能相似性的疾病基因预测方法,通过数据挖掘获取疾病的相关基因本体术语,利用功能相似性分析基因与疾病之间的相关程度,并根据该相关程度对所有候选基因进行排序,从而识别出致病基因。测试结果显示,该方法能有效预测没有已知功能注释的致病基因。  相似文献   

2.
针对与某种特定器官组织相关的疾病,利用新基因识别、基因功能预测以及疾病基因预测等技术,提出并实现一个基于基因功能信息的疾病候选基因预测系统。将其用于心血管疾病相关基因的大规模分析与预测,结果证明,该系统可以对疾病候选区间的已知基因进行致病可能性的鉴别,发现新基因,并判定新基因与疾病的相关程度。  相似文献   

3.
比较基因或基因产物功能上的相似性是生命科学研究的一项重要内容,它在生物大分子功能预测、基因聚类、生物网络分析和疾病相关基因筛选等方面具有广泛的应用。计算基因之间的功能相似性已经成为生物信息学研究的基础性工作。基因本体GO(Gene Ontology)体系集成了多种异质数据库的信息,用结构化的自然语言术语对基因和基因产物的功能进行注释和分类,是研究基因功能相似性的有力工具。从GO术语之间相似性、基因之间功能相似性两个方面,总结和评述过去十几年里,人类利用生物信息学方法在语义水平上研究基因功能相似性的进展和取得的成果,分析基因功能相似性计算方法存在的问题和面临的挑战,指出基于GO体系的基因功能相似性度量方法今后的主要研究方向。  相似文献   

4.
毛蓝  刘渊  梅娟 《计算机工程与设计》2007,28(18):4401-4402,4406
现在对高性能、高效性流量测量的研究表明网络流量呈现统计上的自相似性.因此,网络预测在网络管理中占据重要地位.使用QPSO(quantum-behaved particle swarm optimization)对预测自相似性网络流量的最小均值峰度(LMK)方法进行优化,能够获得较小的信噪比SNR-1(signal to noise ratio).通过对真实网络流量的仿真实验,表明该方法能比LMK(最小均值峰度)算法更精确的预测网络流量.  相似文献   

5.
软件缺陷预测是典型的类不均衡学习问题,其中有缺陷的样本数量远少于无缺陷的样本数量,但有缺陷的样本通常是预测的重点。现有的软件预测模型大多建立在基于静态度量元的软件缺陷数据集上,重点关注如何平衡类分布,而忽略了数据集中属性特征对软件缺陷的判别能力。当软件缺陷数据集中的属性特征对类目标概念缺乏判别能力时,传统机器学习算法难以构建有效的软件缺陷预测模型,从而无法获得有效的预测性能。为此,提出了一种基于不相似性的软件缺陷预测算法,通过改善软件缺陷数据集中属性的判别能力,进而提升软件缺陷预测性能。实验证明:基于不相似性的软件缺陷预测算法能够有效地改善传统机器学习算法在软件缺陷数据集上的预测性能。  相似文献   

6.
7.
许多链路预测方法仅仅关注预测的准确度衡量指标,忽略了精确度衡量标准在实际应用中的重要作用,且没有考虑共同邻居与预测节点间紧密度对相似性刻画的影响。针对上述问题,提出了一种基于拓扑连接紧密度的相似性链路预测算法。该方法通过局部拓扑结构定义共同邻居紧密度,并引入参数调节不同网络中紧密程度,最终刻画网络节点间的相似度。6个实际网络测试表明,相比共同邻居(CN)、资源分配(RA)、Adamic-Adar(AA)、局部路径(LP)、Katz等相似性指标,该算法提升了链路预测的预测精度。  相似文献   

8.
数据预处理是基于相似性的寿命预测方法的首要步骤,重点研究了变工况下数据预处理的方法。首先研究了其必要性,随后从线性模型和非线性模型的角度研究了多工况健康评估方法。从数据标准化、基于经验信噪比的特征加权和基于主成分分析的特征降维研究了多工况数据标准化方法。研究证明,多工况数据标准化方法更适于相似性寿命预测中的数据预处理。  相似文献   

9.
链路预测作为复杂网络分析的一个重要分支,在不同领域中有着广泛的应用,而且通过进一步提取网络结构信息可以提高链路预测的精度。提出了一种基于结构深度网络嵌入和关联相似性的链路预测算法(Structural Deep Correlation Similarity Network Embedding,SDCSNE)。SDCSNE算法结合了网络嵌入捕捉高维非线性网络结构的特征,将网络映射到向量空间中,这些映射向量的内积即为对应节点的相似性,并保持了全局和局部的网络结构,获得了更加稳定的网络结构信息;SDCSNE算法还融入了节点的关联性,以提高预测的准确性。实际结果表明,在链路预测任务中,SDCSNE算法具有良好的性能。  相似文献   

10.
随着大数据时代的来临,microRNA与基因的序列数据不断增加,如何从大量的数据中挖掘有生物学意义的信息成为新的热点问题。研究表明microRNA间以协作的方式在疾病中发挥作用,并呈现出网络的结构化趋势。因此,系统分析不同microRNA间的相似性将在疾病生物学标记挖掘等研究领域起到关键的桥梁作用。而microRNA通过调节其靶基因发挥作用,所以本研究将充分利用现有靶基因数据,从功能角度分析microRNA间的相似性。研究选取前期工作所得的靶基因优化列表,利用富集分析将基因集合转化为功能节点集合,并在此基础上利用集合相似性测度计算microRNA对在不同层面的功能一致性。结果表明,相同家族的microRNA倾向于调控相同或相似的靶基因;类比于非靶基因,microRNA靶基因倾向于共享较多相似的细胞组分,而在生物学通路及生物学过程中则具有相对较低的相似性。  相似文献   

11.
本体映射过程中概念相似度计算方法的改进   总被引:1,自引:0,他引:1       下载免费PDF全文
针对本体映射中概念相似度计算中存在的一些不足之处,提出了一种改进的方法。首先根据本体概念树的特点以及数据挖掘的思想,提出了一种改进的侯选映射集设置的方法,减少了相似度计算的工作量。进而根据本体和本体中概念的特点,综合概念名称、概念实例、概念的属性、结构、关系等因素。设计了一种改进的相似度的计算方法。改善了相似度计算中存在的片面性和不完善性问题,提高了本体映射的查全率和查准率。初步实验表明该算法在计算复杂度、查全率和查准率上都要优于Glue方法。  相似文献   

12.
一个基于语义元的相似度计算方法研究   总被引:5,自引:1,他引:5  
针对已有相似性度量方法的局限与不足,对属性进行语义扩展,提出了基于语义元支持度的相似度计算方法,该方法用语义元表示概念内涵,在语义元中引入支持度来表现不同语义元对概念表示的贡献,综合考虑相关性、相似性、非对称性以及语义元的支持度,通过比较语义元的相似性,实现了概念相似性的度量。把关系作为一种特殊的概念进行关系的比较,得到了基于语义元的本体相似性度量。最后,将该方法与其他方法进行比较,验证了该方法的计算结果更具有合理性,同时也验证了该方法的有效性与正确性。  相似文献   

13.
为解决本体异构、实现不同本体应用程序间互操作以及数据集成,提出一种基于RDF图的改进相似度传播匹配算法。首先通过WordNet发现初始相似对种子,经过预处理把本体表示成RDF三元组形式,针对RDF图的特点,将相似度传播的条件扩展到三元组中,发现可能相似对;然后采用综合元素特征的方法计算相似度。相似度传播、发现可能相似对种子、相似度计算是一个循环迭代的过程,直到满足收敛条件。实验表明了该算法的有效性,并在时间性能上也有所提高。  相似文献   

14.
基于领域本体综合考虑属性、语义距离、层次深度和调节因子等多种因素对词语相似度的影响,提出计算词语相似度的方法.实验证明,该方法充分利用了领域本体中概念的层次关系和属性特点,并把它们结合起来,利用词语之间的相似度对文本的向量空间模型进行扩展,达到了较好的文本分类效果.  相似文献   

15.
针对目前本体映射过程中相似度计算存在的问题 ,提出了一种综合的相似度计算方法。首先判断不同本体之间是否存在相关性 ,若相关 ,则充分考虑各种相关因素 ,从语义和概念两个层面来进行比较 ;然后给出本体的综合相似度计算方法 ;最后采用两组测试数据对该方法进行实验 ,并与 GLUE系统的概率统计方法进行了实验对比。实验结果表明 ,该方法能够有效确保相似度计算的准确性。  相似文献   

16.
事件本体相比于传统本体具有更加丰富的语义信息,在面向事件的大数据集成中更具优势,然而用传统的本体相似计算方法计算事件本体相似度存在很多不足,提出了一种综合的事件本体相似度计算方法。该方法以词语相似度、集合相似度、层次结构相似计算为基础,然后从事件类名称、事件类要素、事件类层次结构和非层次结构讨论事件本体的相似度,最终获得事件本体的综合相似度。实验表明该方法相比传统本体相似度计算方法准确率更高,语义信息更加丰富。  相似文献   

17.
一种基于本体的语义相似度算法研究   总被引:1,自引:0,他引:1  
赵永金  郑洪源  丁秋林 《计算机应用》2009,29(11):3074-3076
在研究目前比较经典的基于语义距离的相似度算法的基础上,通过分析语义概念的其他关键因子,增加了节点密度以及概念属性对语义相似度的影响,提出了一个更为规范的相似度算法。通过实验分析证明,改进后算法所得相似度值更加合理,在一定的调节参数下,与人类主观判断的兼容度比原始算法提高了约15%。  相似文献   

18.
提出了基于语义相似度和相关度的综合概念相似度计算方法.语义相似度考虑了语义距离和本体库特征,加入概念的信息量、概念的深度、概念的密度和不对称因子的辅助影响;语义相关度从直接相关、间接相关、直接继承和间接继承几个方面考虑.通过实验和两种传统的语义相似度计算方法进行对比,本方法能更好地区分本体树中不同关系的概念对,验证了该方法的有效性.  相似文献   

19.
基于启发式规则的本体概念语义相似度匹配   总被引:1,自引:0,他引:1  
杨哲 《计算机应用》2007,27(12):2919-2921
在本体概念模型的层次结构中,概念的语义相似度与概念间的语义距离成反比例关系,同时越靠近底层的概念所描述的信息越具体,因此若概念间最近共同祖先的深度越大,则概念的语义相似度越大。考虑到这两个因素,构造了计算本体概念语义相似度的启发式规则及相应的公式,通过对本体实例的分析,验证了公式的有效性。公式中两个经验参数的选择与本体概念模型的深度有关,根据目前本体概念模型的深度大小,给出了经验参数合理的取值。  相似文献   

20.
一种衡量基因语义相似度的新方法*   总被引:1,自引:1,他引:0  
利用GO (Gene Ontoloty) 来衡量基因之间的相似度是近年来研究的热点。传统的方法在准确性上有一定的弊端,本文提出了一种新的方法来衡量基因之间的语义相似度。该方法的主要原则是同时依赖于GO拓扑结构图中基因注释项之间的路径长度和基因注释项的公共祖先节点在GO拓扑结构图中的深度。本文用人工数据和取自酵母基因数据库的基因数据进行了实验,结果表明本文的方法比传统方法更有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号