共查询到15条相似文献,搜索用时 61 毫秒
1.
T细胞表位预测技术对于减少实验合成重叠肽、研究病原体与机体作用的免疫机制以及深入理解T细胞介导的免疫特异性均有重要意义。为增强T细胞表位预测模型的可理解性,本文在通过肽的预处理构建出存储等长肽段的决策表之后,设计出了一种基于粗集的T细胞表位预测方法。该方法由基于信息熵的属性约简完备算法和基于锚点知识的属性值顺序约简改进算法共同组成。基于HLA-DR4(B10401)编码的MHCII类分子结合肽的实验数据表明,在预测精度与传统神经网络方法大致相当的基础上,本文方法可以提取出用于帮助专家理解MHC分子与抗原肽结合机理的产生式规则。 相似文献
2.
涂淑琴 《计算机工程与应用》2005,41(24):33-35
文章提出了一种应用于T细胞表位预测的模块化神经网络,这种神经网络先用一个过滤模块将不可结合的蛋白质序列过滤掉,然后将可结合的蛋白质输入到各个分类模块中进行训练学习,最后根据三个分类模块的结果进行最大值判定输出最后结果。实验结果证明,用这种模块化神经网络结构对T细胞表位进行预测比单个BP神经网络具有更高的准确率和数据的自我组织及学习能力。 相似文献
3.
在综述了T细胞表位预测的定义,意义和研究现状的基础上,分析了当前流行的基于误差反向传播前馈神经网络(BPNN)的T细胞表位预测模型的不足,即网络结构较难确定、训练速度慢和难以增量学习等,提出了利用排序学习前向掩蔽(SLAM)模型及其增量学习算法作为T细胞表位预测方法,并给出了构建T细胞表位预测模型的基本步骤。基因HLA-DR4 (B1*0401)编码的MHC II类分子结合肽的应用实例表明,与基于BPNN的T细胞表位预测模型相比,基于SLAM的T细胞表位预测模型不但能在极短时间内完成样本的学习,而且能有效地实现增量学习。 相似文献
4.
冯莉 《计算机与数字工程》2014,(11):2017-2021,2145
针对远程教育中传统的集成算法通常以批模式方式运行而导致其在连续生成数据的情况下不可用的问题,提出了一种基于分类器组合增量集成的远程教育学生表现预测算法。首先,简要介绍了三种备受关注的集成分类算法:朴素贝叶斯的增量版本、1‐NN和WINNOW算法;然后,在训练数据集上利用三种算法产生各自的假说;最后,将三种假说进行集成,并利用投票方法预测学生的表现。在希腊远程教育大学“信息”课程提供的训练集 HOU 上的实验结果表明,相比其它几种较好的分类器,该文算法取得了更好的分类精度和更少的训练时间,为教师提供了强有力的学生表现预测工具。 相似文献
5.
线性B细胞表位是由抗原分子表面肽链上连续的氨基酸残基构成的序列,准确预测不仅有助于揭示抗原-抗体之间的相互作用机制,而且可以极大地降低定位的时间成本和人工成本,提高工作效率。论文简要综述了线性B细胞表位的特性,回顾了近几年来的预测方法和预测服务器确定线性B细胞表位的常用方法和表位分析的研究方法,对于疾病的预防和诊治等应用研究也具有极大的推动作用。 相似文献
6.
任彦荣 《计算机与应用化学》2011,28(6):734-740
尝试将“复制”、“杂交”、“变异”算子和“Metropolis”采样策略引入到微粒群算法(PSO)搜索进程,并将其用于前馈型多层神经网络(FMANN)连接权值优化当中,形成了1种新的非线性统计建模方法:混合微粒群神经网络系统(hybrid particle Swarmoptimizer-artificial neura... 相似文献
7.
针对目前人们对分类性能的高要求和多分类器集成实现的复杂性,从基分类器准确率和基分类器间差异性两方面出发,提出了一种新的多分类器选择集成算法。该算法首先从生成的基分类器中选择出分类准确率较高的,然后利用分类器差异性度量来选择差异性大的高性能基分类器,在分类器集成之前先对分类器集进行选择获得新的分类器集。在UCI数据库上的实验结果证明,该方法优于bagging方法,取得了很好的分类识别效果。 相似文献
8.
对于现实的复杂网络而言,有连边的节点对数目通常远小于无连边的节点对数目,在链路预测时,不同类别的样本数量不平衡会导致预测的分类结果与真实情况有较大的偏差。针对此问题,本文提出更优的链路预测算法,先对网络拓扑信息进行特征提取,再设计出一种集成分类器对数据样本进行平衡处理,然后基于网络的拓扑信息改进了分类器的集成规则,最后将训练出的集成分类器同现有的4个针对不平衡分类的链路预测学习算法进行对比研究。通过对4个不同规模的时序网络进行链路预测,结果表明:本文的链路预测学习算法具有更高的召回率,同时也保证了预测结果的准确性,从而更好地解决了链路预测中因类别不平衡导致的误分类问题。 相似文献
9.
预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容.基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征.将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度.结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具.以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据.3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用.有望发展成为亚细胞定位研究的有用工具. 相似文献
10.
针对集成分类器由于基分类器过弱,需要牺牲大量训练时间才能取得高精度的问题,提出一种基于实例的强分类器快速集成方法——FSE。首先通过基分类器评价方法剔除不合格分类器,再对分类器进行精确度和差异性排序,从而得到一组精度最高、差异性最大的分类器;然后通过FSE集成算法打破已有的样本分布,重新采样使分类器更多地关注难学习的样本,并以此决定各分类器的权重并集成。实验通过与集成分类器Boosting在UCI数据库和真实数据集上进行比对,Boosting构造的集成分类器的识别精度最高分别能达到90.2%和90.4%,而使用FSE方法的集成分类器精度分别能达到95.6%和93.9%;而且两者在达到相同精度时,使用FSE方法的集成分类器分别缩短了75%和80%的训练时间。实验结果表明,FSE集成模型能有效提高识别精度、缩短训练时间。 相似文献
11.
Aijun An Ning Shan Christine Chan Nick Cercone Wojciech Ziarko 《Engineering Applications of Artificial Intelligence》1996,9(6):645-653
Prediction of consumer demands is a pre-requisite for optimal control of water distribution systems because minimum-cost pumping schedules can be computed if water demands are accurately estimated. This paper presents an enhanced rough-sets method for generating prediction rules from a set of observed data. The proposed method extends upon the standard rough set model by making use of the statistical information inherent in the data to handle incomplete and ambiguous training samples. It also discusses some experimental results from using this method for discovering knowledge on water demand prediction. 相似文献
12.
针对现有煤矿瓦斯预测专家系统因没有新知识获取措施及知识自更新功能而预测效果不佳的问题,提出了基于粗集的知识获取方法。该方法首先建立瓦斯数据与瓦斯突出强度之间关系的预测样本集;然后运用粗糙集的连续属性离散化、属性约简以及规则提取算法,从大量的预测样本集中自动获取预测知识,并将预测知识存储于专家系统知识库中;最后基于推理机实现煤矿瓦斯突出的实时预测。实例分析验证了该方法在煤矿瓦斯突出预测专家系统知识获取中的有效性和实用性。 相似文献
13.
14.
Case-based reasoning (CBR) is one of the main forecasting methods in business forecasting, which performs well in prediction and holds the ability of giving explanations for the results. In business failure prediction (BFP), the number of failed enterprises is relatively small, compared with the number of non-failed ones. However, the loss is huge when an enterprise fails. Therefore, it is necessary to develop methods (trained on imbalanced samples) which forecast well for this small proportion of failed enterprises and performs accurately on total accuracy meanwhile. Commonly used methods constructed on the assumption of balanced samples do not perform well in predicting minority samples on imbalanced samples consisting of the minority/failed enterprises and the majority/non-failed ones. This article develops a new method called clustering-based CBR (CBCBR), which integrates clustering analysis, an unsupervised process, with CBR, a supervised process, to enhance the efficiency of retrieving information from both minority and majority in CBR. In CBCBR, various case classes are firstly generated through hierarchical clustering inside stored experienced cases, and class centres are calculated out by integrating cases information in the same clustered class. When predicting the label of a target case, its nearest clustered case class is firstly retrieved by ranking similarities between the target case and each clustered case class centre. Then, nearest neighbours of the target case in the determined clustered case class are retrieved. Finally, labels of the nearest experienced cases are used in prediction. In the empirical experiment with two imbalanced samples from China, the performance of CBCBR was compared with the classical CBR, a support vector machine, a logistic regression and a multi-variant discriminate analysis. The results show that compared with the other four methods, CBCBR performed significantly better in terms of sensitivity for identifying the minority samples and generated high total accuracy meanwhile. The proposed approach makes CBR useful in imbalanced forecasting. 相似文献