首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
针对传统差异表达基因识别方法不能处理异质性数据集以及分析结果偏差较大的问题,提出了一个基于元分析及标准差过滤技术的差异表达基因识别算法标准差排序分析(RS-DM)。对来自于不同实验平台的数据进行整合分析,过滤掉伪差异表达基因PDEGs,并找出遗失的真正的差异表达基因TDEGs。经实验验证,算法简单有效。  相似文献   

2.
不同实验条件下差异表达基因(DEGs)的识别是微阵列数据分析的主要目标之一,针对分析结果中具有高排名的基因往往表现出较低差异表达水平的缺点,提出了一种基于简单统计排名模型的差异表达基因识别算法MRP(Matrix rank product)。算法可直接处理基因芯片原始数据,排除了数据预处理方法对算法的干扰;另外,通过对基因芯片数据形成的矩阵进行整体排序计算,得到具有高准确度的差异表达性排名结果。  相似文献   

3.
现有的网络微观结构对社团特性影响的定性和定量分析,方法上还没有通用可靠的框架,实验数据集一般较小,说服力不强,此外也没有充分拆解各因素之间的耦合性。在定性分析上,采用基于零模型和“显著性检验”的微观结构对社团特性影响的分析方法,对各种类型网络进行了社团结构显著性检测,实现了微观结构对社团特性影响的质性分析。在定量分析上,提出基于零模型和“中介效应分析”的微观结构对社团特性影响的分析方法,将已知社团结构显著性类型网络的原始网络与零模型或零模型与零模型间模块度值作差,剔除微观结构对社团特性的作用,量化出不同社团结构显著性类型网络的不同阶数网络微观结构对社团特性的贡献程度。该文使用社交生物、科技、交通、经济、信息等不同规模的550个实证网络进行实验分析,全面深入分析了微观结构对社团特性产生的作用,有利于理解社团特性的形成机制。  相似文献   

4.
目的提出一种可以发现不同密度层次分布的聚类算法,解决多层次不同密度数据集的聚类问题.方法采用对数据对象的k-邻居距离进行排序,利用线性回归分析方法发现密度区域变化的边界,对同一个密度区域中的点利用DBSCAN算法进行聚类,获得了多密度级别的类.结果使用真实数据集与人工数据集测试结果表明,此算法可以发现现有算法所不能发现的模式.结论算法在时间效率上与DBSCAN相同,空间效率上随着输入数据的数目增加而线性增长,同时此算法可适用于高维数据集.  相似文献   

5.
提出了一种基于时频联合分析的鼠标动力学认证方法.对用户操作鼠标行为的连续时序信号进行小波包变换,依据不同频带的子信号提取其时频联合分布特征,并使用递归特征消除法筛选出特征.采用随机森林算法建立用户独特的鼠标行为模式,据此进行用户身份认证.为验证方法的有效性,采取单因素实验设计,以特征分析方法为唯一因素,采集真实网络环境中40个用户在31个月内的鼠标行为数据,对其中18个用户分别采用时序分析和时频联合分析提取并筛选特征;使用相同算法建立用户鼠标行为模式,对比了基于2种特征分析方法的可信身份认证系统的性能差异.结果显示,相比时序分析方法,所提方法将可信身份认证的操作特性曲线下的面积从97.02%提升为99.10%.  相似文献   

6.
随着基因组测序完成和基因技术不断发展,使得某些疾病的致病基因逐渐得到确认。目前,通过科学实验已经掌握了一部分疾病的致病原因,但是大部分疾病的致病原因,特别是与基因相关的疾病的致病原因还不得而知。该文采用与人类同源相似度高达85%的小鼠数据作为研究对象,使用疾病表型数据集、致病基因数据集和已经确认的表型?基因关联关系数据集构成一个双层耦合网络,通过元路径上随机游走的方法进行数据的分析与挖掘,在已经确认的表型?基因关联数据基础上预测未确定的表型?基因关联关系。经验证比较,该文提出的算法所取得的预测效果优于其他算法。  相似文献   

7.
依据图像区域的对比度以及空间位置等先验视觉显著性知识,进行了自下而上、数据驱动的图像显著性区域检测。首先,提取图像中的前景区域,构造区域的对比度、空间位置特征函数,然后融合这些特征计算显著图。该算法将图像的空间关系与区域关系联系起来,得到了较精确的显著图。通过对国际上现有的公开数据集MSRA-1000的测试结果表明:本文算法可以抑制非显著区域干扰,显著图的一致性较高。同时,将本文算法的显著图应用于分割显著性区域,能够得到较好的分割效果。  相似文献   

8.
针对微阵列数据的标准化方法进行系统阐述,对高密度寡核苷酸阵列(Affymetrix芯片)的两类主要标准化算法:全数据算法和基线算法进行了探讨,同时对其他标准化算法(复合算法、VSN算法、全局loess算法、Invariant set算法等)进行了综合的论述和分析.基于标准数据集对前两类标准化算法处理的效果和效率做了对比测试,结果表明,算法在数据变异性的消除方面,对于非差异表达数据,全数据算法可以达到比较优秀的处理结果;对于差异表达数据,Quantile和Non-linear算法比较有效.在算法的耗时方面,Scale算法最优.全面考虑时间效率和标准化处理效果,Quantile算法具有一定的综合优势.  相似文献   

9.
以往大多告警分析研究都是假设通信网络中所有告警是平等的,考虑此假设的不合理性,提出了一种加权告警分析方法。首先,根据告警对网络的影响程度,采用熵值法为不同的告警分配不同的权值,并将其转换成适合于数据挖掘的序列数据集;然后,设计了一种加权告警序列模式挖掘算法,并采用了一种新颖的剪枝策略来缩减需要挖掘的数据集大小以提高算法的效率;最后,利用该算法挖掘告警数据中的时序关系。实验结果表明,这种加权告警分析方法在剪枝效果、挖掘重要告警序列模式和执行效率方面具有很好的性能。  相似文献   

10.
结合Vague集理论和动态故障树分析方法,提出一种基于代数模型求解的Vague动态故障树的机电作动器可靠性分析方法。定义了动态故障树的时间算子,给出了动态逻辑门的代数模型,推导了运算律的证明;为了规范动态故障树顶事件的结构函数,给出了最小割序集的规范化算法。底事件使用三角形Vague集可靠性数据充分考虑底事件概率水平的不确定性;用代数模型对动态故障树进行建模,具有通用性,考虑了故障发生的时序性更符合机电作动器的原理。将代数模型表达分解为静态和动态两部分分别进行分析,降低了计算量。分析结果表明了该方法可以有效地对机电作动器进行可靠性分析,为故障定位提供思路,更具灵活性。  相似文献   

11.
在有限的网络边缘资源约束下,考虑到业务的多样性和网络接入的异构性对任务卸载和计算资源分配的影响,在本地和服务器共同处理任务的背景下,提出了一种异构网络场景下结合李雅普诺夫优化理论和搜索树算法对任务卸载和计算资源分配的联合优化方法,分析了卸载收益与延迟之间的折中关系,优化了任务卸载与计算资源分配。同时,为了对搜索树进行快速分支定界,设计了一种卸载优先级准则。最后,通过仿真实验验证了所提算法的有效性和合理性。  相似文献   

12.
为了提高对于乳腺癌差异基因筛选的准确率,从分子层面出发,结合拷贝数与基因表达两方面特征,分析了乳腺癌差异表达基因,研究了乳腺癌的发病机制,为乳腺癌的诊疗提供了新的研究思路.在癌症基因组图谱中下载乳腺癌的拷贝数和基因表达数据,利用R软件通过卡方检验提取乳腺癌拷贝数差异基因,结合edgeR差异基因分析算法,筛选乳腺癌差异表达基因,利用ks检验关联两方面差异基因,分析其相关性,结合string数据库构造蛋白质互作网络,筛选核心基因,通过生存分析和GO富集分析验证结果的准确性.以基因差异表达倍数大于1,p值小于0.05为标准,筛选出基因表达差异基因共有10 579个,上调基因7 543个,下调基因3 036个,经验证发现,ATAD2B等8个基因与乳腺癌的发生发展密切相关.  相似文献   

13.
用于不同密度聚类的多阶段等密度线算法   总被引:10,自引:1,他引:9  
多阶段等密度线算法是在基于网格的等密度线聚类算法的基础之上 ,采用多阶段的聚类方式来解决分布密度变化较大的数据集的聚类分析问题. 该算法能够找出分布密度不同的各种类别 ,并能很快地处理高维数据集. 此外 ,还能有效地对时间序列数据集进行聚类.  相似文献   

14.
针对域名系统(DNS)中存在异常查询的问题,提出了一种基于日志信息的DNS查询异常检测算法,以检测异常的互联网协议地址(IP).通过分析DNS正常与异常请求行为的区别,提取了DNS日志中多个维度的信息来表征源IP;其次,利用降维处理将数据映射到三维空间,以便直观地可视化呈现和快速地进行数据分析;最后,利用聚类分析和计算各源IP的可信度,检测出异常的源IP.实验结果表明,所提算法不但能直观观察到多维数据集中的关联特性,而且能从全局和局部2个层面识别网络中异常的源IP.  相似文献   

15.
基于模糊c-均值聚类的微阵列基因表达数据分析   总被引:5,自引:2,他引:3  
微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c-均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种有用工具.  相似文献   

16.
17.
传统的决策树算法是数据分布敏感的,面对数据分布偏斜的样本集时,常导致少数类别样本的分类精度很低。已有的可以处理偏斜样本集的决策树算法只针对两种类别样本的集合。由此提出了一种新的数据分布不敏感的决策树算法——DTID。该算法通过构造各种新的少数类别样本,调整样本集合的数据分布,提高少数类别样本的分类精度。DTID算法采用样本取模运算减少了算法的运行时间。实验结果表明,与C4.5等算法相比,DTID的分类精度明显提高,即使样本集中包含多种少数类别样本也能获得较好的分类效果。  相似文献   

18.
采用结合转录组、代谢通路、蛋白结构的呼出气体检测生物信息学分析方法来确定肺癌气体标志物,用于肺癌的筛选诊断. 采用标准仪器(GCMS)检测肺癌病人和正常人的呼吸气体样本;经统计分析,筛选出10种特异性挥发性有机物(VOC). 采用转录组分析得到肺癌和健康人的差异表达基因,其富集的代谢通路与人体内产生VOC的代谢通路一致,证明所筛选的VOC标志物与肺癌病人代谢具有相关性. 基于此VOC建立的肺癌诊断模型的灵敏度、特异性和整体正确率分别为86.2%,91.2% 和89.6%,说明所提方法能简便、有效区分正常人和肺癌病人,为早期肺癌筛查提供方便、可靠的检测方法.  相似文献   

19.
针对生物序列分析中的多序列比对问题,设计了一个求解多序列比对问题的混合遗传算法(与之相应的软件称为HGA-COFFEE),该算法采用COFFEE函数作为个体的适应度函数,构造了5种新的遗传算子,包括1种选择算子,2种交叉算子和2种变异算子,其中一种变异算子基于COFFEE的一致性信息设计,以改善算法的整体搜索能力;另一种变异算子基于动态规划方法设计,以增强其局部搜索能力。最后,通过对BAliBASE中144个测试例的测试,证明该算法是有效的,与已有的算法相比,该算法对处于朦胧区和具有N/C末端延伸的序列比对问题有更强的问题求解能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号