首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
有效分析蛋白质家族是生物信息学的一项重要挑战,聚类成为解决这一问题的主要途径之一.基于传统序列比对方法定义蛋白质序列间相似关系时,假设了同源片断问的邻接保守性,与遗传重组相冲突.为更好地识别蛋白质家族,提出了一种蛋白质序列家族挖掘算法ProFaM.ProFaM首先采用前缀投影策略挖掘表征蛋白质序列的模式,然后基于模式及其权重信息构造相似度度量函数,并采用共享最近邻方法,实现了蛋白质序列家族聚类.解决了以往方法在蛋白质模式挖掘及相似度设计中的不足.在蛋白质家族数据库Pfam上的实验结果证实了ProFaM算法在蛋白质家族分析上有良好的结果.  相似文献   

2.
一种用于蛋白质结构聚类的聚类中心选择算法   总被引:1,自引:0,他引:1  
黄旭  吕强  钱培德 《自动化学报》2011,37(6):682-692
提出一种对蛋白质结构聚类中心进行选择的算法. 聚类是蛋白质结构预测过程中必不可少的一个后处理步骤, 而目前在蛋白质结构预测中常用的属性阈值(Quality threshold, QT)聚类算法依赖于由经验得出的聚类半径; 其他聚类算法, 如近邻传播(Affinity propagation, AP)聚类算法也存在影响聚类分布的参数. 为克服对主观经验参数的依赖,本文提出一种聚类中心选择算法(Exemplar selection algorithm, ESA), 用于对不同参数下的聚类结果进行分析,从而选择最佳聚类中心,进而确定聚类半径等经验参数. 该算法在真实蛋白质结构数据集上进行了实验,在未知经验参数情况下选择出最佳聚类中心, 同时也为不同聚类算法寻找适合相应数据集的客观聚类参数提供了支持.  相似文献   

3.
从序列出发预测水解酶亚家族类型具有重要意义.本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类型.选择参数后,三种方法各自在最优运行参数下预测水解酶亚家族的准确率分别为:85.15%,82.65%和80.14%.其中以Z标度的伪氨基酸组成效果最佳,比氨基酸组成识别精度提高12.85%.本文研究结果说明从序列出发,预测水解酶亚家族是可行的,且修正的伪氨基酸组成可望成为一种新的有效提取蛋白质序列特征值的方法.  相似文献   

4.
氨基酸序列编码问题一直是在蛋白质结构预测中导致算法输入空间较大的主要原因。只有对氨基酸序列进行更好的编码.才能为后续进行计算机分析打下基础。提出并实现了综合考虑了氨基酸序列的划分和长程作用效应,利用氨基酸正交编码区分每个氨基酸个体,利用基本正交矩阵获得氨基酸在物理、化学、生物上的相似性,利用分属概率来获得当前蛋白质序列中氨基酸构成不同二级结构的趋势的新的混合编码方法,从而改进了氨基酸残基序列编码,并利用现有算法比较了不同编码方式对蛋白质二级结构预测的影响,结果证实该编码方式能够提高蛋白质二级结构预测的准确性。  相似文献   

5.
蛋白质相互作用(PPI)网络是生物信息学的一个新的研究领域。近年来谱聚类算法在未知蛋白质的功能预测方面发挥了重要作用,但是它要求事先确定聚类数目,为此提出了一种基于边的得分搜索的谱聚类算法。该算法采用谱聚类方法对数据进行预处理,并通过构造蛋白质节点之间的边的得分矩阵找到数据样本之间的相关性,同时融入粒子群算法来确定边的得分的最佳选择阈值,最后用广度优先遍历结点的方法得到聚类结果。算法在PPI网络数据集上进行了测试,结果表明该算法不但可以自动确定聚类数目,而且聚类结果的正确率和F-measure值都得到了提高。  相似文献   

6.
氨基酸序列编码问题一直是在蛋白质结构预测中导致算法输入空间较大的主要原因。只有对氨基酸序列进行更好的编码,才能为后续进行计算机分析打下基础。提出并实现了综合考虑了氨基酸序列的划分和长程作用效应,利用氨基酸正交编码区分每个氨基酸个体,利用基本正交矩阵获得氨基酸在物理、化学、生物上的相似性,利用分属概率来获得当前蛋白质序列中氨基酸构成不同二级结构的趋势的新的混合编码方法,从而改进了氨基酸残基序列编码,并利用现有算法比较了不同编码方式对蛋白质二级结构预测的影响,结果证实该编码方式能够提高蛋白质二级结构预测的准确性。  相似文献   

7.
蛋白质序列作为生物序列数据一个重要组成部分,对其的分析研究已经成为生物信息学中的一个重要的研究方向和内容.通过对序列进行模式挖掘,可以对蛋白质序列或某一蛋白质家族序列进行研究,因此蛋白质序列的模式挖掘已经成为蛋白质序列研究中的一项重要任务.MBioPM是一种最新的生物序列模式挖掘算法,该算法通过引入模式划分概念,提高算法的效率,但该算法在效率方面仍存在不足,而且挖掘结果存在冗余性的问题.因此,提出一种优化算法BioPMMH,通过带有模式划分特点的Hash链表结构来优化算法中的搜索空间及策略,并在算法过程中对重复模式进行过滤.实验表明,算法BioPMMH能有效提高模式挖掘的效率,并解决结果的冗余性问题.  相似文献   

8.
加窗窄通带滤波器蛋白质编码区预测算法   总被引:1,自引:1,他引:0  
改进Gabor小波变换(Modified Gabor wavelet transform,MGWT)蛋白质编码区预测算法给出的预测结果在当前所有的独立预测算法中准确率最高.本文提出了有限脉冲响应(Finite impulse response,FIR)加窗窄通带滤波器蛋白质编码区预测(Windowed narrow pass-band filter,WNPBF)算法.算法的主要部分包括:以F56F11.4序列为例给出了WNPBF阶数选择的依据,并据此设计WNPBF;为消除滤波器群延迟对预测结果产生的不良影响,对信号用边界对称延拓法进行预处理并对窄带滤波器滤波输出信号进行截取;为改善预测结果,设计滑动平均滤波器平滑功率谱密度曲线.在ALLSEQ和HMR195两个DNA序列集上获得预测准确率分别接近或达到独立预测算法的最高水平.通过比较后发现,所提出的WNPBF算法较MGWT算法效率更高,使用该算法可以直观和客观地比较不同滤波器的预测结果.  相似文献   

9.
氨基酸含量是影响蛋白质耐热性的主要因素,为了提高以氨基酸含量为特征向量的蛋白质耐热性预测的精度和预测模型的性能,提出了一种基于机器学习蚁群算法(ACO)优化支持向量机(SVM)参数的蛋白质耐热性预测方法。建立了SVM参数优化模型,探讨了基于网格划分策略的连续蚁群算法,通过对SVM的惩罚因子和径向基核函数的全局搜索,筛选出最优参数,使SVM的蛋白质耐热性预测率最优。结果表明:采用未优化的SVM建立的预测模型的蛋白质耐热性总预测率相对较低,约为76.5%,采用遗传算法优化预测模型参数后的预测率约为86.6%,采用ACO优化预测模型参数后预测率达到87.8%。采用ACO优化的SVM模型参数的寻优速度快,预测结果准确。  相似文献   

10.
提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了大量实验比较,验证了所提出的干预策略评价优化算法具有较高精度,效率比朴素方法高出3个数量级,适合在实际系统中处理海量干预评价.  相似文献   

11.
基于样本权重更新的不平衡数据集成学习方法   总被引:1,自引:0,他引:1  
不平衡数据的问题普遍存在于大数据、机器学习的各个应用领域,如医疗诊断、异常检测等。研究者提出或采用了多种方法来进行不平衡数据的学习,比如数据采样(如SMOTE)或者集成学习(如EasyEnsemble)的方法。数据采样中的过采样方法可能存在过拟合或边界样本分类准确率较低等问题,而欠采样方法则可能导致欠拟合。文中将SMOTE,Bagging,Boosting等算法的基本思想进行融合,提出了Rotation SMOTE算法。该算法通过在Boosting过程中根据基分类器的预测结果对少数类样本进行SMOTE来间接地增大少数类样本的权重,并借鉴Focal Loss的基本思想提出了根据基分类器预测结果直接优化AdaBoost权重更新策略的FocalBoost算法。对不同应用领域共11个不平衡数据集的多个评价指标进行实验测试,结果表明,相比于其他不平衡数据算法(包括SMOTEBoost算法和EasyEnsemble算法),Rotation SMOTE算法在所有数据集上具有最高的召回率,并且在大多数数据集上具有最佳或者次佳的G-mean以及F1Score;而相比于原始的AdaBoost,FocalBoost则在其中9个不平衡数据集上都获得了更优的性能指标。  相似文献   

12.
在基于多假设预测的视频压缩感知重构中, 不同图像块对应的假设集匹配程度差异较大, 因此重构难度差异明显. 本文提出多假设局部增强重构算法(Local enhancement reconstruction algorithm based on multi-hypothesis prediction, MH-LE), 利用帧间相关性对图像块进行分类后针对运动图像块提出像素域双路匹配策略, 通过强化图像块基本特征来提高相似块匹配效果, 获取更高质量的假设集; 同时将结构相似度评价标准引入假设块权值分配过程, 提高预测精度. 仿真结果表明, 所提算法的重构质量明显优于其他多假设预测重构算法. 和基于组稀疏的重构算法相比, 所提算法具有更快的重构速度, 在大部分的采样率条件下具有更高的重构质量.  相似文献   

13.
武静雯  江凌云  刘祥军 《计算机应用研究》2021,38(10):3131-3136,3142
针对在网络切片场景下以往的VNF(虚拟网络功能)资源分配策略无法满足动态的资源需求,很容易导致资源分配不足或过度分配的问题,提出了一种基于两阶段算法(two-stage algorithm,TSA)的VNF资源需求预测方法.该方法首先基于数据特征筛选出与预测目标高度相关的候选特征集,然后利用贪婪式前向搜索策略对候选特征集进一步筛选获得最优特征集,最终训练出不同类型的预测模型.仿真结果表明,基于该方法所训练的模型可以获得更好的预测性能,同时该方法的可扩展性较好,训练好的模型可以直接集成到现有的VNF部署算法中应用.  相似文献   

14.
针对一般链路预测算法在具有层次结构的脑网络中计算效率低且复杂度高的问题,提出了一种基于最大似然估计的层次随机图模型。该算法首先利用脑网络数据建立层次随机图,然后通过改进的马尔科夫蒙特卡罗算法采样树状图空间,最后计算脑网络边的平均连接概率,且通过评价指标对算法进行评价。实验结果表明,利用该算法对脑网络和3种不同的层次结构网络进行链路预测比较, 脑网络的预测结果最好。此外,所提出的算法较之传统的基于相似性的算法,该算法效果明显,且具有理想的计算复杂度。  相似文献   

15.
李改  李磊  张佳强 《计算机应用》2021,41(12):3515-3520
传统的基于评分预测的社会化协同过滤推荐算法存在预测值与真实排序不匹配的固有缺陷,而基于排序预测的社会化协同排序推荐算法更符合真实的应用场景。然而,现有的大多数基于排序预测的社会化协同排序推荐算法要么仅仅关注显式反馈数据,要么仅仅关注隐式反馈数据,没有充分挖掘这些数据的价值。为充分挖掘用户的社交网络和推荐对象的显/隐式评分信息,同时克服基于评分预测的社会化协同过滤推荐算法存在的固有缺陷,在xCLiMF模型和TrustSVD模型基础上,提出一种新的融合显/隐式反馈的社会化协同排序推荐算法SPR_SVD++。该算法同时挖掘用户评分矩阵和社交网络矩阵中的显/隐式信息,并优化排序学习的评价指标预期倒数排名(ERR)。在真实数据集上的实验结果表明,采用归一化折损累计增益(NDCG)和ERR作为评价指标,SPR_SVD++算法均优于最新的TrustSVD、MERR_SVD++和SVD++算法。可见SPR_SVD++算法性能好、可扩展性强,在互联网信息推荐领域有很好的应用前景。  相似文献   

16.
为了使高校的就业指导工作更具针对性,可以有针对性地培养学生,本文收集了毕业生的相关信息及其各自的就业情况,构建了基于HMIGW特征选择和XGBoost的分类预测建模算法,并将其应用于毕业生就业预测.本文首先考虑到学生信息数据具有离散型和连续型混合的特点,提出一种适应于就业预测的基于互信息和权重的混合(Hybrid feature selection based on Mutual Information and Gain Weight,以下简称HMIGW)特征选择算法,该方法先对学生数据的特征做相关性估值,然后采用前向特征添加后向递归删除策略进行特征选择,最后基于选择后的最优特征子集数据用XGBoost预测模型进行训练与结果预测.通过对比不同算法的结果,本文采用的预测方法在准确率和时间等评价指标上有较好的表现,对于毕业生培养就业指导具有积极作用.  相似文献   

17.
李萍  汪芬  陈祺东  孙俊 《计算机应用》2021,41(3):803-811
针对求解复杂网络的多目标社区发现问题,提出了一种离散化随机漂移粒子群优化(DRDPSO)算法。首先,通过对社区进行随机化编码操作和针对随机漂移算法的离散化操作,来改善局部网络结构并逐渐增强全局模块度值;其次,根据核K均值(KKM)和比例割(RC)两个目标函数来控制网络中的社区规模、缓解模块度分辨率限制;最后,根据多目标求解策略逐步更新Pareto非劣解集,从Pareto非劣解集选取满足需求的目标社区结构。为了验证所提算法的有效性,将DRDPSO算法与其他社区发现算法在三种具有10个不同参数设置的生成网络及三种真实网络上进行对比实验,并采用两个最佳社区评价指标对各算法获得的社区发现结果进行对比分析。实验结果表明,使用DRDPSO算法求解复杂网络的多目标社区发现问题时,获得的社区发现评价指标(归一化互信息和模块度)最高的概率达到95%以上。可见DRDPSO算法在真实网络进行应用能进一步地提高网络社区划分的精确度和鲁棒性。  相似文献   

18.
The prediction accuracy and generalization ability of neural/neurofuzzy models for chaotic time series prediction highly depends on employed network model as well as learning algorithm. In this study, several neural and neurofuzzy models with different learning algorithms are examined for prediction of several benchmark chaotic systems and time series. The prediction performance of locally linear neurofuzzy models with recently developed Locally Linear Model Tree (LoLiMoT) learning algorithm is compared with that of Radial Basis Function (RBF) neural network with Orthogonal Least Squares (OLS) learning algorithm, MultiLayer Perceptron neural network with error back-propagation learning algorithm, and Adaptive Network based Fuzzy Inference System. Particularly, cross validation techniques based on the evaluation of error indices on multiple validation sets is utilized to optimize the number of neurons and to prevent over fitting in the incremental learning algorithms. To make a fair comparison between neural and neurofuzzy models, they are compared at their best structure based on their prediction accuracy, generalization, and computational complexity. The experiments are basically designed to analyze the generalization capability and accuracy of the learning techniques when dealing with limited number of training samples from deterministic chaotic time series, but the effect of noise on the performance of the techniques is also considered. Various chaotic systems and time series including Lorenz system, Mackey-Glass chaotic equation, Henon map, AE geomagnetic activity index, and sunspot numbers are examined as case studies. The obtained results indicate the superior performance of incremental learning algorithms and their respective networks, such as, OLS for RBF network and LoLiMoT for locally linear neurofuzzy model.  相似文献   

19.
张永韡  汪镭 《控制与决策》2020,35(6):1297-1306
算法选择(AS)问题旨在为给定问题在算法集合中选择最佳算法.随着优化算法的不断提出,算法选择问题是优化领域亟待解决的问题.提出基于聚类的元启发算法五星评价体系,将算法性能指标映射至整数评价以减小评价空间.通过测试24种常见优化算法与4种最新CEC大赛优胜算法在219种、3000多个标准测试问题上的性能,得到评价矩阵.将评价矩阵作为训练数据,使用协同过滤(CF)算法建立算法评价的预测模型.使用该模型预测算法集内的所有算法在新问题上的评价,结果显示所提出方法预测精度较高,超过90%的预测最佳算法为最终可行算法.敏感性分析显示,该方法在先验信息有限的情况下仍可以保持较高的预测精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号