共查询到19条相似文献,搜索用时 734 毫秒
1.
用于T细胞表位预测的分类器集成方法* 总被引:1,自引:1,他引:0
T细胞表位预测技术对于减少实验合成重叠肽,理解T细胞介导的免疫特异性和研制亚单位多肽及基因疫苗均有重要意义.为弥补已有基于机器学习方法的T细胞表位预测模型的可理解性的不足并进一步提高模型的预测精度,首先通过肽的预处理构建出了存储等长肽段的决策表,而后提出了基于粗糙集的分类器集成算法.该算法不但综合利用了基于信息熵的属性约简完备算法和其他属性约简算法的优势,而且将T细胞表位预测领域中的锚点知识融入到了属性值约简过程中.最后利用该算法来预测MHC Ⅱ类分子HLA-DR4(B1·0401)的结合肽,首次提取出了预测精度高且能帮助专家理解MHC分子与抗原肽的结合机理的产生式规则,为下一步的分子建模工作奠定了基础. 相似文献
2.
在综述了T细胞表位预测的定义,意义和研究现状的基础上,分析了当前流行的基于误差反向传播前馈神经网络(BPNN)的T细胞表位预测模型的不足,即网络结构较难确定、训练速度慢和难以增量学习等,提出了利用排序学习前向掩蔽(SLAM)模型及其增量学习算法作为T细胞表位预测方法,并给出了构建T细胞表位预测模型的基本步骤。基因HLA-DR4 (B1*0401)编码的MHC II类分子结合肽的应用实例表明,与基于BPNN的T细胞表位预测模型相比,基于SLAM的T细胞表位预测模型不但能在极短时间内完成样本的学习,而且能有效地实现增量学习。 相似文献
3.
胡桂武 《计算机工程与应用》2008,44(18):9-11
MHC II类分子结合肽的预测对于免疫研究和疫苗设计非常重要,然而其结合肽长度的可变性等原因使其预测变得极为困难,提出了一种基于广义选择性神经网络集成的MHC II分子结合肽预测算法,该算法是一种双层集成模型。第一层是用微分进化算法去生成初始神经网络集成池,第二层是从初始神经网络集成池中选择部分组成最终的神经网络集成。实验结果表明广义选择性神经网络集成比传统的选择性神经网络有更好的泛化性能。 相似文献
4.
胡桂武 《计算机工程与应用》2008,44(18)
MHC Ⅱ类分子结合肽的预测对于免疫研究和疫苗设计非常重要,然而其结合肽长度的可变性等原因使其预测变得极为困难,提出了一种基于广义选择性神经网络集成的MHC Ⅱ分子结合肽预测算法,该算法是一种双层集成模型.第一层是用微分进化算法去生成初始神经网络集成池,第二层是从初始神经网络集成池中选择部分组成最终的神经网络集成.实验结果表明广义选择性神经网络集成比传统的选择性神经网络有更好的泛化性能. 相似文献
5.
一种基于相对区分表的属性约简算法 总被引:3,自引:3,他引:3
属性约简是知识获取中的核心问题之一。为了能较高效率地获得属性约简,在Rough Set理论基础上构造出了相对区分表,将基于相对区分表的属性约简的判定算法(JRA)作为子算法并结合归纳属性约简算法的优点,设计出了基于相对区分表的归纳属性约筒算法(RA)。算例说明该算法具有较高的属性约简效率,并能取得较好的约简结果。 相似文献
6.
为了求取决策表系统中属性的最小约简,本文提出了一种基于免疫算法的属性约简方法。该算法应用决策表的相对核来初始化种群,根据决策属性对条件属性的依赖度和抗体中条件属性的个数设计抗体的适应度函数,通过免疫记忆特性和抗体浓度的促进与抑制作用,保持了个体的多样性,提高了算法的全局搜索能力,避免陷入局部最优现象,从而求解出最小属性约简集合。实验结果表明,算法快速、有效,能得到较好的最小属性约简。 相似文献
7.
基于改进区分表的核属性约简算法 总被引:1,自引:0,他引:1
知识约简是一个NP难问题,在众多知识约简方法中,核属性基本上作为属性约简的初始解,这样就能有效地减小约简算法在属性空间中的搜索范围,在一定程度上加速了知识约简的进行.然而,核属性解基本上是利用Hu的分辨矩阵法求得的.结合Hu的分辨矩阵算法,讨论了Hu以及Wroblewaski区分表算法中存在的问题,改进了区分表的定义并结合Ye方法提出了基于区分表核属性约简算法,既克服了分辨矩阵方法的缺陷,又避免了区分表算法中存在的问题.实验结果表明该算法能有效求出决策系统的属性核. 相似文献
8.
洪灾灾情预测是预防和了解洪灾的重要手段.为了解决传统的洪灾灾情预测算法的不足,提出基于折半查找的最优属性约简算法(OAR-BSA),最大限度地降低影响洪灾灾情数据的因素,并在此基础上,结合基因表达式编程的概念,给出了基于属性约简的GEP洪灾灾情预测算法(FFGEP-AR).仿真实验表明,OAR-BSA算法求解最优约简比传统的算法要快,FFGEP-AR算法比传统预测算法的平均耗时要小,预测的准确率要高. 相似文献
9.
Pawlak粗糙集的知识约简包括对决策表的知识约简和对信息表的知识约简。作为Pawlak粗糙集的扩展,邻域粗糙集在针对决策表的属性约简方面应用广泛,而针对信息表的属性约简方面应用鲜少。为了设计一种适用于信息表的属性约简算法,根据Pawlak粗糙集的信息表知识约简标准,首先提出一种邻域粗糙集的信息表知识约简标准,然后根据这种标准,结合贪心思想,进一步提出了一种适用于聚类任务的信息表属性约简算法。与主成分分析(principal component analysis,PCA)算法相比,实验结果表明用该算法对数据集降维后,得到的属性约简集合的属性个数较多,K-means算法根据属性集合进行聚类的精度较高。实验结果证明该算法能有效地应用于信息表的属性约简方面。 相似文献
10.
11.
12.
为了解决单一神经网络模型很难满足股票预测建模要求的问题,提出一种基于遗传算法的粗糙集属性约简方法和神经网络相结合的预测模型。在该模型中,改进了自适应性遗传算法的交叉算子与变异算子。基于该遗传算法的粗糙集属性约简相比传统的粗糙集属性约简,其具有更强的求解最小属性约简的能力,解决了神经网络预测时训练速度慢、内存开销大等问题;在数据预处理过程中,引入聚类分析,有效解决了连续属性离散化的问题。实验结果证明,该预测模型具有较高的预测精度,在时间序列的股票预测中是相当有效的。 相似文献
13.
Peptide vaccination for cancer immunotherapy requires identification of peptide epitopes derived from antigenic proteins associated with the tumor. Such peptides can bind to MHC proteins (MHC molecules) on the tumor-cell surface, with the potential to initiate a host immune response against the tumor. Computer prediction of peptide epitopes can be based on known motifs for peptide sequences that bind to a certain MHC molecule, on algorithms using experimental data as a training set, or on structure-based approaches. We have developed an algorithm, which we refer to as PePSSI, for flexible structural prediction of peptide binding to MHC molecules. Here, we have applied this algorithm to identify peptide epitopes (of nine amino acids, the common length) from the sequence of the cancer-testis antigen KU-CT-1, based on the potential of these peptides to bind to the human MHC molecule HLA-A2. We compared the PePSSI predictions with those of other algorithms and found that several peptides predicted to be strong HLA-A2 binders by PePSSI were similarly predicted by another structure-based algorithm, PREDEP. The results show how structure-based prediction can identify potential peptide epitopes without known binding motifs and suggest that side chain orientation in binding peptides may be obtained using PePSSI. 相似文献
14.
针对神经网络在股票预测中遇到的困难,在预测模型中引入粗糙集理论,提出一种基于粗糙集与神经网络相结合的预测方法,并根据基本遗传算法的弱点对其进行了改进。首先,介绍了基于遗传算法的属性约简方法,对各遗传因子进行改进。然后,采用基于改进遗传算法的属性约简方法对模型的样本数据进行约简,删除冗余数据,得到样本输入的最小约简。最后,利用约简后的样本对预测模型进行训练与检验。实验结果表明,该方法具有较高的预测精度,能有效地解决网络结构复杂、学习速度缓慢等问题。 相似文献
15.
属性约简是一种特殊的特征选择方法,是粗糙集理论中的核心内容之一。正域约简是一类常见的启发式的约简方法,它通常采用前向贪婪搜索策略产生候选的属性子集,以相对正域作为启发信息和停止条件。根据互补条件熵的随划分的变化规律,分四种情况分析了约简过程中某个属性加入属性子集后,相对正域和互补条件熵的变化,并在此基础上提出了一种以互补熵为启发信息的正域属性约简方法。实验分析表明,新方法与传统的正域约简算法相比,可以得到属性数量更少且决策性能非常接近的约简,同时可以有效地提高约简计算效率。 相似文献
16.
基于邻域粗糙集的属性约简算法在进行属性约简时只考虑单一属性对决策属性的影响,未能考虑各属性间的相关性,针对这个问题,提出了一种基于卡方检验的邻域粗糙集属性约简算法(ChiS-NRS)。首先,利用卡方检验计算相关性,在筛选重要属性时考虑相关属性之间的影响,在降低时间复杂度的同时提高了分类准确率;然后,将改进的算法与梯度提升决策树(GBDT)算法组合以建立分类模型,并在UCI数据集上对模型进行验证;最后,将该模型应用于预测肝癌微血管侵犯的发生。实验结果表明,与未约简、邻域粗糙集约简等几种约简算法相比,改进算法在一些UCI数据集上的分类准确率最高;在肝癌微血管侵犯预测中,与卷积神经网络(CNN)、支持向量机(SVM)、随机森林(RF)等预测模型相比,提出的模型在测试集上的预测准确率达到了88.13%,其灵敏度、特异度和受试者操作曲线(ROC)的曲线下面积(AUC)分别为87.10%、89.29%和0.90,各指标都达到了最好。因此,所提模型能更好地预测肝癌微血管侵犯的发生,能辅助医生进行更精确的诊断。 相似文献
17.
18.
19.
属性约简是粗糙集理论中的重要问题。许多学者针对邻域粗糙集提出多种属性约简方法,包括应用最为广泛的启发式算法。在多半径邻域粗糙集的基础上,针对当前启发式约简算法往往会包含一定冗余属性的缺陷,提出一种融合属性权重影响的改进约简运算方法,通过根据各属性权值大小设置阈值使得约简结果能够消除冗余属性。实验选取UCI的数据集与当前几种常用启发式约简算法进行比较分析。实验结果表明,所提出的属性约简方法能够得到更优的约简集合,同时更大程度地保留了决策表本身的知识信息,具有较高的分类能力。 相似文献