首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对肿瘤基因表达谱样本少,维数高的特点,提出一种用于肿瘤信息基因提取和亚型识别的集成分类器算法.该算法根据基因的Fisher比率值建立候选子集,再采用相关系数和互信息两种度量方法,分别构造反映基因共表达行为和调控关系的特征子集.粒子群优化算法分别与SVM和KNN构成两个基分类器,从候选子集中提取信息基因并对肿瘤亚型进行分类,最后利用绝对多数投票方法对基分类器的结果进行整合.G.Gordon肺癌亚型识别的实验结果表明了该算法的可行性和有效性.  相似文献   

2.
采用相空间重构方法将一维脑电信号转换成复杂网络进行研究。将一维时间序列构造成多维相空间,计算多维时间序列任两个向量点间的距离得到加权矩阵,选择恰当的阈值将加权矩阵转换成二进制矩阵,该二进制矩阵视做时间序列所对应的复杂网络的邻接矩阵,阈值的选择使得生成的复杂网络满足连通性。利用该方法对睁眼和闭眼时的脑电信号进行辨别分析。结果表明,两信号的递归图、网络拓扑图、网络度分布和模体分布均表现出显著不同。因此,此分析方法为利用复杂网络实现分析和辨识不同脑电提供了新的思路。  相似文献   

3.
肿瘤病人的辐射敏感性预测对于肿瘤的治愈具有重要意义.基于上述原因,文中提出融合生物网络拓扑特性的肿瘤放疗敏感基因信号识别方法.首先基于基因表达谱和肿瘤样本SF2存活率之间的Spearman相关系数,初步估算每个基因的辐射敏感度.然后根据目前已知的基因网络和蛋白质互作网络等生物网络的拓扑性质,利用随机行走算法进行校正.最后筛选辐射敏感基因,并以此为特征训练肿瘤样本SVM分类器.实验表明文中方法比现有常用的线性回归法和微阵列数据显著性分析法更加有效,识别的辐射敏感基因有利于临床肿瘤个性化放疗的施行.  相似文献   

4.
肿瘤特征基因的选择是肿瘤基因表达数据分类的研究热点之一。针对传统的肿瘤特征基因选择方法无法很好地剔除冗余基因,提出一种混合型的特征选择方法。在所提出的方法中,首先将标签相同的样本划分到同一个矩阵,在所有矩阵中,当且仅当特征间的相关系数均大于特定阈值时,即判定这几个特征是相关特征,并对这些相关的特征进行聚类。然后在每个聚类中选择Fisher比最大的特征,对这些特征根据评价函数筛选得到最优特征子集。最后采用SVM分类器对这些最优特征子集进行类别预测。在四个标准的肿瘤DNA微阵列数据集的测试结果证明所提出的肿瘤基因特征选择方法的稳定性和高效性。  相似文献   

5.
宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年。充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作。在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展。相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6 块GPU卡获得了263.8倍的加速。  相似文献   

6.
为了对基因表达数据矩阵中的肿瘤基因与正常基因进行判别分类,文章提出了基于支持向量机(Supporting Vector Machine,SVM)的肿瘤基因识别方法。在对基因进行特征选择的基础上,对只具有最优特征的基因样本再利用SVM分类思想进行判别,最后通过与其他方法所得结果进行对比可知,该方案在不降低分类准确度的同时,能有效地避免特征空间维数远大于样本空间维数所造成的“过学习”问题,而且避免了大的时空开销,具有很强的实用性。  相似文献   

7.
为了进一步提高视频镜头的分割精度,提出了一种基于局部相似性的视频镜头分割方法。首先为了有效地进行视频特征降维,提出了改进的保局投影算法,利用仿射传播聚类算法得到具有相同模式的相似样本,根据相似样本构建连接矩阵,并根据降维前后模式的相关系数确定最佳降维维数,该算法有效地保留了数据的局部分布信息;然后利用具有相同模式的相似样本构建局部支持向量机检测镜头边界。实验结果表明,该方法利用样本的局部相似性特点,在视频特征提取和镜头边界检测两个阶段提高了镜头分割精度。  相似文献   

8.
肿瘤基因表达谱分类特征基因选取问题及分析方法研究   总被引:18,自引:1,他引:18  
对肿瘤分类特征基因选取问题的研究是发现肿瘤特异表达基因、研究肿瘤基因表达模式的重要手段,文中基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究,首先对基于Relief算法的特征选取策略加以改进生成候选特征集合;然后以支持向量机作为分类器对其分类性能进行检验以选取分类特征基因;最后结合分类模型。利用灵敏度分析方法进行特征基因的精确搜索以滤除冗余,基于该方法文中选出了52个具有良好分类性能的特征基因作为肿瘤的基因特征,并对其表达行为进行了简要分析。  相似文献   

9.
运用复杂网络理论,对TCGA胃癌数据进行了筛选与降维,筛选出275个胃癌相关的基因,获得样本容量为40的胃癌ⅡB期样本组和样本容量为36的胃癌ⅢA期样本组。通过分析胃癌ⅡB期样本组与胃癌ⅢA期样本组的基因变化率,建立节点(基因)间的连边关系,从而构建了胃癌恶化过程的基因表达网络。引入综合中心性指标对网络进行分析,筛选出17个综合中心指数较高的基因。应用复杂网络的相关理论对胃癌基因网络进行社区划分,发现17个综合中心指数较高的基因全部落在一个规模较大的连通的子网络中,此拓扑结构与胃癌基因表达网络的关键节点一致。通过综合分析获取了胃癌恶化过程中的关键基因,提供了良好的胃癌恶化早期的预警信号。  相似文献   

10.
刘健  顾扬  程玉虎  王雪松 《自动化学报》2022,48(5):1246-1258
通过分析基因突变过程, 提出利用强化学习对癌症患者由正常状态至患病状态的过程进行推断, 发现导致患者死亡的关键基因突变. 首先, 将基因视为智能体, 基于乳腺癌突变数据设计多智能体强化学习环境; 其次, 为保证智能体探索到与专家策略相同的策略和满足更多智能体快速学习, 根据演示学习理论, 分别提出两种多智能体深度Q网络: 基于行为克隆的多智能体深度Q网络和基于预训练记忆的多智能体深度Q网络; 最后, 根据训练得到的多智能体深度Q网络进行基因排序, 实现致病基因预测. 实验结果表明, 提出的多智能体强化学习方法能够挖掘出与乳腺癌发生、发展过程密切相关的致病基因.  相似文献   

11.
结直肠癌是消化系统常见的恶性肿瘤之一,死亡率居发达国家恶性肿瘤死亡率的第3位。本文通过生物分析进行结直肠癌致病基因的识别。首先,基于GEO中GSE9348基因表达数据集,利用R语言的LIMMA包筛选出P<0.05,Fold change>2的结直肠癌差异基因339个;其次,基于OMIM数据库中已知结直肠癌的致病基因和STRING数据库,获得差异表达基因与致病基因的蛋白质互作网络;接着利用Cytoscape软件的ClusterONE插件进行蛋白质互作网络模块分析,获得一个含有53个基因的子网络;最后,通过对子网络的拓扑分析,获得了FOS、CCND1、CEBPB、EGR1和NOS3等5个新结直肠癌致病基因。同时,通过功能富集分析和文献挖掘对新发现的致病基因进行验证。  相似文献   

12.
为捕捉样本之间的复杂关系,提升噪声鲁棒性,提出一种基于动态超图学习拉普拉斯矩阵的无监督特征选择方法。通过对训练样本的协方差矩阵施加正交约束,利用超图动态学习拉普拉斯矩阵分别保持低维训练样本的全局和局部结构,获取样本之间的复杂关系;引入的两种子空间学习方法增强特征选择的辨别能力。通过公共数据集实验结果验证了提出方法能够提升特征选择质量,以及相关上游任务的精度和鲁棒性。  相似文献   

13.
针对复杂系统中构建网络的边相关系数阈值法,以金融网络为研究对象,改变以往的使用固定阈值的方法,提出根据相关系数矩阵和金融网络的内在属性确定阈值的新方法。基于股票的相关系数矩阵确定了网络的有效阈值区间,根据可以反映网络内在属性的最大连通子图的节点个数的变化情况来确定阈值,给出了构建金融网络的具体步骤。研究发现,利用该方法构建的金融网络拓扑结构显著。该方法可以推广应用到其他网络中。  相似文献   

14.
异常用电检测旨在识别出不符合正常用电规律或者违反用电合约的用电行为。针对现有基于重构的检测方法依赖标记的正常样本和难以捕捉复杂时间依赖性的问题,提出一种基于深度孪生自回归网络的无监督异常用电行为检测模型(DSAD)。所提模型通过两个孪生自回归子网络来分别独立地对无标记的输入数据进行重构,再将两个子网络的重构误差相结合来预测数据中的正常样本,并利用多头自注意力机制来有效地捕捉时间依赖性、周期性和随机性等复杂特征。在大规模时序数据集和国家电网真实用电数据集上进行实验所获得的结果表明,所提模型在AUC以及AP等性能指标上取得了更好的检测效果。  相似文献   

15.
目前,随着下一代测序技术(Next-Generation Sequencing technology,NGS)的发展,围绕高通量测序数据的微卫星不稳定(Micro-Satellite Instability,MSI)探测方法与软件工具层出不穷,但存在需要配对正常组织测序数据做参照或大量微卫星稳定(Micro-Satellite Stable,MSS)样本的正常组织测序数据构建基准线的问题,这会在一定程度上给使用者造成不便.针对以上问题,本文提出一种基于信息熵理论使用样本肿瘤组织测序数据探测MSI的模型.首先,基于之前开发的探测软件MSlsensor1.1,增加在单肿瘤组织测序数据上探测样本MSI状态的模块,扩增后的软件可实现基于两种数据模式的MSI探测.两种数据模式分别是肿瘤与正常组织成对测序数据和单肿瘤组织测序数据.其次,对扩展模块进行性能评估.依托于该模块,使用样本肿瘤组织的外显子测序数据对衡量软件性能的指标进行评估.结果显示,本研究提出的基于信息熵理论在单肿瘤组织测序数据上的探测模块性能表现较好,这为后续更为复杂的变异信号探测提供了理论依据和技术支撑.  相似文献   

16.
高娟  王国胤  胡峰 《计算机科学》2012,39(10):193-197
从信息学角度出发寻找肿瘤相关基因、发现肿瘤基因表达特征对肿瘤的诊断和治疗具有重要的生物学意义,而肿瘤与正常组织的分类是其中一个重要应用。根据多类别肿瘤基因表达谱,提出了一种自动特征选择方法。首先,结合非参数方法和filter思想,利用决策序列的随机性度量基因的权值并排序;然后,采用相关信息熵进行冗余性排除,自动地选择出具有高分辨能力、低冗余度的特征基因子集。实验结果表明,提出的方法能从多类别肿瘤基因表达谱数据中自动选出30个具有良好分类能力的特征基因,且具有较高的正确识别率。  相似文献   

17.
癌症基因微阵列数据中冗余基因过多,增加了基因子集规模,导致计算难度提升、判断性能下降.采用高维随机矩阵构建了一种癌症基因网络识别方法,利用维度较高的随机变量构成高维随机矩阵,根据随机矩阵与相关矩阵的属性特征,在系数矩阵右边增加一列扩增随机矩阵,基于矩阵的不失一般性,采用奇异值分解式,完成相关矩阵奇异值拆分,划分随机噪声与真实信息,通过计算各特征重要程度,去除冗余以及与类别不存在关联性的特征,明确高维随机矩阵理论降噪参数后,选取相关系数不小于降噪参数的基因,实现基因网络识别.仿真结果表明,所提方法可简便有效观测基因关联,实现癌症基因网络识别.  相似文献   

18.
提出利用迁移字典解决复杂行为数据集标签样本不足的问题。所提出的方法使用简单行为作为源域,来辅助识别由一系列简单行为组成的复杂行为。通过稠密轨迹提取视频的低级特征,利用字典学习从简单行为和复杂行为的低级特征中分别获得相应的稀疏表示,并利用简单行为的稀疏表示通过迁移矩阵改善复杂行为的稀疏表示。因此,即使在复杂行为标签样本较少的情况下,迁移字典也能够获得更有效的高级特征。同时,利用GAN在特征层面上进行数据增强,帮助学习表征能力更强的字典。提出的方法在UCF101和HMDB51两个数据上进行了实验,在小样本量的情况下获得了比现有方法更好的识别结果,证明了方法的有效性。  相似文献   

19.
根据操作流程,提出了构建复杂武器系统健康管理指标体系的两种方法:层析法和聚合法,并对其优缺点进行了分析;通过对BP网络分析,得出网络权值矩阵能够反映输入对输出的影响程度的结论,并基于此原理进行了健康管理指标筛选;利用BP网络良好的非线性映射能力,提出了一种构造隶属度矩阵的客观方法,并对指标体系进行了评价;经实际验证,样本训练均方误差为9.887×10-4,构造的隶属度矩阵能够较好反映各级别之间的隶属关系,构造的健康管理指标体系比较合理。  相似文献   

20.
时滞耦合和非时滞耦合的奇异复杂动态网络之同步性准则   总被引:1,自引:0,他引:1  
本文利用李雅普诺夫稳定性理论,对时滞耦合和非时滞耦合的奇异复杂动态网络之同步获得了一些新的充分条件.这些条件均可转化为求解一组线性矩阵不等式(LMI).在降低准则保守性的过程中,本文充分运用了矩阵函数的凸性和自由权重矩阵理论.最后给出了两个数例;与已有文献做了比较,说明本文结论的有效性,以及较低的保守性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号