首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 576 毫秒
1.
近年来,基于基因表达谱的肿瘤分类问题引起了广泛关注,为癌症的精确诊断及分型提供了极大的便利.然而,由于基因表达谱数据存在样本数量小、维数高、噪声大及冗余度高等特点,给深入准确地挖掘基因表达谱中所蕴含的生物医学知识和肿瘤信息基因选择带来了极大困难.文中提出一种基于迭代Lasso的信息基因选择方法,以获得基因数量少且分类能力较强的信息基因子集.该方法分为两层:第一层采用信噪比指标衡量基因的重要性,以过滤无关基因;第二层采用改进的Lasso方法进行冗余基因的剔除.实验采用5个公开的肿瘤基因表达谱数据集验证了本文方法的可行性和有效性,与已有的信息基因选择方法相比具有更好的分类性能.  相似文献   

2.
在处理高度不平衡数据时,代价敏感随机森林算法存在自助法采样导致小类样本学习不充分、大类样本占比较大、容易削弱代价敏感机制等问题.文中通过对大类样本聚类后,多次采用弱平衡准则对每个集群进行降采样,使选择的大类样本与原训练集的小类样本融合生成多个新的不平衡数据集,用于代价敏感决策树的训练.由此提出基于聚类的弱平衡代价敏感随机森林算法,不仅使小类样本得到充分学习,同时通过降低大类样本数量,保证代价敏感机制受其影响较小.实验表明,文中算法在处理高度不平衡数据集时性能较优.  相似文献   

3.
双向纹理函数(BTF)表面一般采用点采样数据来定义表面的光照属性,因而这类表面很难运用基于面片分割的辐射度方法进行绘制,提出一种将辐射度算法扩展到包括BTF表面场景的有效方法.对表面的BTF样本区域首先进行像素聚类,再在各个像素类内对视线采样方向做进一步自适应的聚类,在各个视线类内像素分别拟合一个低频光照甬数,并求它们在各个视线类内光照细节的高频光照函数.低频光照函数作为该表面区域的平均反射属性参与辐射度计算,生成场景的整体光照效果;然后利用计算的辐射度值和高频光照函数重建该表面区域的BTF材质细节.文中方法不仅取得了较高的压缩效率,而且在BTF材质表面产生了辉映等全局光照效果.最后利用硬件实现了视点快速改变时的场景绘制.  相似文献   

4.
文中在分析现有的相对辐射校正方法的局限性基础上,提出了一种基于分段辐射校正的星载TDI-CCD成像数据辐射处理方法.该方法利用实验室定标数据对探元不同感光范围的光电响应模式采用不同的模型进行拟合,从而提高定标系数或者查找表的拟合精度.文中选取资源1号02BHR光学影像进行实验,实验结果表明文中提出的方法与现有的方法相比有较大提高.  相似文献   

5.
该文采用复杂网络理论。首先利用分类信息指数对数据进行初步筛选,选出了314个基因。对选出的基因分别做肿瘤样本和正常样本的相关系数矩阵,利用Kruskal算法分别对两个相关系数矩阵做最小生成树,然后通过比较选出阈值,建立起节点间的连边关系,得到致病前后的两个网络。根据复杂网络中的相关理论,分别对肿瘤样本和正常样本进行社区划分,最后通过观察两个样本的网络系统,分析致病前后基因的变化情况,建议了结肠癌的特征基因。  相似文献   

6.
目前,由大多数基因调控网络的重构方法推导出的网络结构是静态的,即不随时间改变.但在细胞周期或一个有机体的不同生长阶段,调控网络的拓扑结构会发生显著变化.这为深入了解基因调控的时空机制带来困难.因此,文中提出一种基于时延互信息和核权重l1正则化Logistic回归模型学习时变结构基因调控网络的算法.将其应用于两种生物情景数据:黑腹果蝇在不同阶段的肌肉发育和酿酒酵母苯菌灵中毒后的反应.实验结果显示,该方法能反映不同细胞状态对基因间相互作用的影响,有效获取基因调控网络随时间变化的动态效应.  相似文献   

7.
基于k近邻的标签噪声过滤对近邻参数k的选取较敏感.针对此问题,文中提出近邻感知的标签噪声过滤算法,可有效解决二分类数据集的类内标签噪声的问题.算法分开考虑正类样本和负类样本,使分类问题中的标签噪声检测问题转化为两个单类别数据的离群点检测问题.首先通过近邻感知策略自动确定每个样本的个性化近邻参数,避免近邻参数敏感的问题.然后根据噪声因子将样本分为核心样本与非核心样本,并把非核心样本作为标签噪声候选集.最后结合候选样本的近邻标签信息,进行噪声的识别与过滤.实验表明,文中方法的噪声过滤效果和分类预测性能均较优.  相似文献   

8.
基因表达谱中存在大量与肿瘤分类无关的基因,严重降低肿瘤诊断的准确率.基因表达谱还存在高维小样本、噪声大等问题,增加肿瘤诊断的难度.为了获取基因数量较少且分类能力较强的信息基因子集,文中提出基于对称不确定性(SU)和支持向量机递归特征消除(SVM-RFE)的信息基因选择方法.首先利用SU评估基因和类标签之间的相关性,根据SU定义近似马尔科夫毯,快速消除大量无关和冗余基因.然后利用SVM-RFE进一步剔除冗余基因,获取有效的信息基因子集.实验表明,文中方法可以在选取维数较少或相等的信息基因子集情况下获取较高的肿瘤分类性能.  相似文献   

9.
肿瘤信息基因启发式宽度优先搜索算法研究   总被引:6,自引:0,他引:6  
基于基因表达谱的肿瘤检测方法有望成为临床医学上一种快速而有效的肿瘤分子诊断方法,但由于基因表达谱数据存在维数过高、样本量很小以及噪音很大等特点,使得肿瘤信息基因选择成为一件有挑战性的工作.根据肿瘤基因表达谱样本集的特点,提出了一种以支持向量机分类性能为评估准则的寻找信息基因的启发式宽度优先搜索算法,其优点是能够同时搜索到基因数量尽可能少而分类能力尽可能强的多个信息基因子集.实验采用了3种肿瘤样本集以验证新算法的可行性和有效性,对于急性白血病、难以分类的结肠癌和多肿瘤亚型的小圆蓝细胞瘤样本集,分别只需2,4和4个信息基因就能获得100%的4-折交叉验证识别准确率.与其它优秀的肿瘤分类方法相比,实验结果在信息基因数量及其分类性能方面具有明显的优越性.为避免样本集的不同划分对分类性能的影响,提出了一种能够更加客观地反映信息基因子集分类性能的全折交叉验证评估方法.  相似文献   

10.
基于卷积神经网络的目标检测方法通过优化区域推荐达到较高的检测精度.由此,文中提出基于有效感受野的区域推荐网络.在区域推荐网络上引入基于有效感受野的样本匹配方法,强化基于交叠比的样本匹配规则,增强特征信息在区域推荐生成时的表征能力,减少锚定框和区域推荐数目,简化锚定框参数设置.结合快速区域的卷积神经网络检测器后,在Pascal VOC数据集上的检测精度有所提升,这表明文中方法是有效的.  相似文献   

11.
The discovery of gene regulatory networks (GRN) from time–course gene expression data (gene trajectory data) is useful for (1) identifying important genes in relation to a disease or a biological function; (2) gaining an understanding on the dynamic interaction between genes; (3) predicting gene expression values at future time points and accordingly; (4) predicting drug effect over time.In this paper, we propose a two-stage methodology that is implemented in the software ‘Gene Network Explorer (GNetXP)’ for extracting GRNs from gene trajectory data. In the first stage, we apply a hybrid Genetic Algorithm and Expectation Maximization algorithm on clustering the large number of gene trajectories using the mixture of multiple linear regression models for fitting the trajectory data. In the second stage, we apply the Kalman Filter to identify a set of first-order differential equations that describe the dynamics of the representative trajectories, and use these equations for discovering important gene interactions and predicting gene expression values at future time points. The proposed method is demonstrated on the human fibroblast response gene expression data.  相似文献   

12.
随着大通量基因芯片数据的产生,基因调控机制的网络化研究需求日趋迫切。提出了基于复杂网络理论的基因调控网络的模拟方法,构建了基因调控网络模拟器GN-Simulator。通过分析真实基因调控网络的拓扑特性,提出了对应的矩阵模型,并充分考虑了网络的生物学鲁棒性和动力学稳定性,给出了人工基因网络的生成过程和计算模拟方法。计算实验表明,GN-Simulator能高效地模拟出与真实基因调控网络高度相似的大规模人工网络,并可为不同算法提供无偏验证的多样化人工模拟数据。  相似文献   

13.
动态基因调控网是展现生物体内基因与基因之间相互关系随时间变化而变化的动力学行为的复杂网络.这种相互作用关系可以分为两类:激励和抑制.对动态基因调控网网络演化的研究,可以预测未来时刻生物体内的基因调控关系,从而在疾病预测和诊断、药物开发、生物学实验等领域起到重要的指导和辅助作用.现实世界中,动态基因调控网的网络演化是一个复杂而巨大的系统,当前,对于其演化机制的研究存在只关注静态网络而忽略动态网络和只关注相互作用关系而忽略相互作用类型的缺陷.针对上述问题,提出了一种动态基因调控网演化分析方法(dynamic gene regulatory network evolution analyzing method,简称DGNE),将研究扩展到了动态带符号网络领域.通过该方法包含的基于模体转换概率的连边预测算法(link prediction algorithm based on motif transfer probability,简称MT)和基于隐空间特征的符号判别算法,能够动态地捕捉基因调控网的演化机制,并准确地预测未来时刻基因调控网的连边情况.实验结果表明,DGNE方法在仿真数据集和真实数据集上均有良好的表现.  相似文献   

14.
俞刚  张泉方 《计算机科学》2015,42(11):248-250, 259
在社会网络中,用户的位置和属性以及图片的标签预测等都具有广泛的应用前景。为了提高标签预测的性能,提出了一种改进的无偏节点标签预测算法。首先,对社会网络中的标签预测问题进行了形式化描述。其次,基于所有观察数据的训练目标的联合概率最大化与以这些数据为条件的单变量边缘预测值的不匹配现象,提出了一种改进的图模型训练方法。最后,通过对置信度的无偏估计,基于子图方法提出一种不包含额外标签数据的无偏算法用于模型的训练。在Twitter和Pokec数据集上的实验表明,提出的算法与相关的标签预测算法相比,其准确性和运行效率都得到了明显的提升。  相似文献   

15.
Complex network is graph network with non-trivial topological features often occurring in real systems, such as video monitoring networks, social networks and sensor networks. While there is growing research study on complex networks, the main focus has been on the analysis and modeling of large networks with static topology. Predicting and control of temporal complex networks with evolving patterns are urgently needed but have been rarely studied. In view of the research gaps we are motivated to propose a novel end-to-end deep learning based network model, which is called temporal graph convolution and attention (T-GAN) for prediction of temporal complex networks. To joint extract both spatial and temporal features of complex networks, we design new adaptive graph convolution and integrate it with Long Short-Term Memory (LSTM) cells. An encoder-decoder framework is applied to achieve the objectives of predicting properties and trends of complex networks. And we proposed a dual attention block to improve the sensitivity of the model to different time slices. Our proposed T-GAN architecture is general and scalable, which can be used for a wide range of real applications. We demonstrate the applications of T-GAN to three prediction tasks for evolving complex networks, namely, node classification, feature forecasting and topology prediction over 6 open datasets. Our T-GAN based approach significantly outperforms the existing models, achieving improvement of more than 4.7% in recall and 25.1% in precision. Additional experiments are also conducted to show the generalization of the proposed model on learning the characteristic of time-series images. Extensive experiments demonstrate the effectiveness of T-GAN in learning spatial and temporal feature and predicting properties for complex networks.  相似文献   

16.
The study of coherence of population dynamics is extremely important for predicting and evaluating the risk of global extinctions. The migration in a network of patch populations (metapopulation) inevitably involves various environmental noises or outside disturbances, which make the migration model time evolving and spatially extended. Thus time-invariant discrete ecological networks are often insufficient to capture the key features of real-world dynamical networks. Here, a time-varying discrete ecological network is proposed to characterize the practical metapopulation for the first time. Based on this model, several novel local coherence criteria are then attained, which provide some new insights into ecological conservation and biological diversity. Moreover, these coherence criteria are also applicable to the synchronization of complex networks in other biological and engineering systems.  相似文献   

17.
随着系统生物学和医学的迅速发展,基因调控网络已经成为一个热点研究领域.布尔网络作为研究生物系统和基因调控网络的一种重要模型,近年来引起了包括生物学家和系统科学家在内的很多学者的广泛关注.本文利用代数状态空间方法,研究了概率级联布尔网络的集镇定问题.首先给出概率级联布尔网络集镇定的定义,并利用矩阵的半张量积给出了概率级联布尔网络的代数表示.其次基于该代数表示,定义了一组合适的概率能达集,并给出了概率级联布尔网络集镇定问题可解的充要条件.最后将所得的理论结果应用于概率级联布尔网络的同步分析及n人随机级联演化布尔博弈的策略一致演化行为分析.  相似文献   

18.
Gene association networks have become one of the most important approaches to modelling of biological processes by means of gene expression data. According to the literature, co-expression-based methods are the main approaches to identification of gene association networks because such methods can identify gene expression patterns in a dataset and can determine relations among genes. These methods usually have two fundamental drawbacks. Firstly, they are dependent on quality of the input dataset for construction of reliable models because of the sensitivity to data noise. Secondly, these methods require that the user select a threshold to determine whether a relation is biologically relevant. Due to these shortcomings, such methods may ignore some relevant information.We present a novel fuzzy approach named FyNE (Fuzzy NEtworks) for modelling of gene association networks. FyNE has two fundamental features. Firstly, it can deal with data noise using a fuzzy-set-based protocol. Secondly, the proposed approach can incorporate prior biological knowledge into the modelling phase, through a fuzzy aggregation function. These features help to gain some insights into doubtful gene relations.The performance of FyNE was tested in four different experiments. Firstly, the improvement offered by FyNE over the results of a co-expression-based method in terms of identification of gene networks was demonstrated on different datasets from different organisms. Secondly, the results produced by FyNE showed its low sensitivity to noise data in a randomness experiment. Additionally, FyNE could infer gene networks with a biological structure in a topological analysis. Finally, the validity of our proposed method was confirmed by comparing its performance with that of some representative methods for identification of gene networks  相似文献   

19.
基于BP神经网络的肿瘤特征基因选取   总被引:2,自引:0,他引:2  
该文提出基于BP神经网络的灵敏度分析方法,并用于选取肿瘤特征基因。以结肠癌基因表达谱为例,首先定义基因对BP神经网络模型输出函数的灵敏度,递归去除灵敏度较低的若干基因,生成一组嵌套的候选特征基因子集。然后以支持向量机为分类器,检验候选特征基因子集对样本分类的贡献,选取错分率最低的候选特征基因子集为结肠癌特征基因子集。通过实验对比,该特征基因子集的分类结果优于文献给出的其他特征基因子集,表明了该方法的可行性和有效性。  相似文献   

20.
郭茂祖  王诗鸣  刘晓燕  田侦 《软件学报》2017,28(11):3094-3102
microRNAs(miRNAs)在生命进程中发挥着重要作用.近年来,预测miRNAs与疾病的关联关系成为一个研究热点.当前,计算方法整体上可以分为两大类:基于相似度度量的方法和基于机器学习的方法.前者通过度量网络中节点之间的关联强度预测miRNA-疾病关联,但需要构建高质量的生物网络模型;后者将机器学习相关算法应用到这个问题中,但需要构建高可信度的负例集合.基于以上困难和不足,提出了一种计算模型BNPDCMDA,用于预测miRNAs-疾病关联关系.该方法首先构建miRNA-疾病双层网络模型,然后利用miRNA的功能相似度对其进行基于密度的聚类,进而将二分网络投影应用于聚类后的miRNAs及疾病集合构成的miRNA-疾病双层子网中,最终完成对miRNA与疾病关联关系的预测.实验结果表明,采用留一交叉验证法得到的AUC值可达99.08%,明显优于当前其他高效方法.最后,采用BNPDCMDA方法对某些常见疾病所关联的miRNAs进行预测,实验结果获得了文献的支持,进一步表明了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号