首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
针对标准L2范数支持向量机和L1范数支持向量机在肿瘤基因分类分析中表现出的优缺点,在利用Bhattacharyya距离剔除部分对分类无关紧要特征基因,从而得到少数高相关至关重要特征基因的基础上,将一种双重正则化支持向量机应用到DNA微阵列分类中。用一种二次多项式损失函数把这种有约束的优化问题改变为无约束且可微的优化问题,这可以用BFGS算法来求解,通过对两种肿瘤特征基因数据集实验分析知,该算法对肿瘤特征基因分类具有较强的可行性和有效性。  相似文献   

2.
基于支持向量机的连续状态空间Q学习   总被引:1,自引:0,他引:1  
针对连续状态空间下的强化学习控制问题,提出一种基于支持向量机的Q学习方法.支持向量机不易陷入局部极小,且有优良的泛化性能,对系统状态一动作对的Q值进行估计计算,解决状态空间泛化中易出现的“维数灾”问题.引入滚动时间窗机制实现支持向量机的在线学习:系统实时检测得到的新数据若不包含新信息,则保持学习的样本集不变;若包含新信息,则滚动时间窗,更新样本集,从而更新支持向量机的回归模型,并对时间窗内的数据分配不同的权值以充分利用数据的信息.倒立摆平衡控制的仿真结果表明该方法能够有效解决具有连续状态的非线性系统的强化学习控制.  相似文献   

3.
针对支持向量机训练样本冗余导致训练效率低下的问题,提出一种基于Fisher向量投影的支持向量机增量算法。该算法根据支持向量机中支持向量的分布特性对初始训练集及增量集进行预处理,减少训练样本个数;通过判断初始样本是否满足新增样本集的卡罗需-库恩-塔克(Karush-Kuhn-Tucker conditions,KKT)条件,剔除对最终结果无用的样本,减少参与训练的样本数目。实验结果表明,与标准支持向量机算法和基于向量投影的支持向量机增量算法相比,基于Fisher向量投影的支持向量机增量算法的训练速度分别提升了86%和33%左右。该方法可用于大规模样本集的分类识别问题。  相似文献   

4.
基于支持向量机的光伏发电功率预测   总被引:1,自引:0,他引:1  
分析了光伏系统的发电特性以及影响光伏发电的因素,建立了基于支持向量机的光伏系统发电功率预测模型.该模型以结构风险最小化原则取代了传统机器学习方法中的经验风险最小化原则,在小样本的机器学习中有着优异的性能.用某一天的数据作为训练样本集,首先对数据进行去噪和归一化,然后用支持向量机方法对样本集进行训练和发电功率预测.仿真结果表明,基于支持向量机的预测模型具有较高的精度,可用于光伏发电系统的预测.  相似文献   

5.
基于支持向量机的增量学习算法研究   总被引:8,自引:0,他引:8  
分析了支持向量机理论中支持向量的特性,利用支持向量与样本空间划分的等价性,提出一种新的基于支持向量机的增量学习算法.该算法考虑新增样本集的分布可能改变对已有样本的分类结果,利用支持向量的分布特性,用对样本的划分差集构造新的支持向量集和分类平面,使差集中的样本点对分类贡献尽可能最大,有效提高了分类精度.同时差集操作简单易行,有效降低了问题的计算复杂度.实验结果表明,与常规增量算法相比,该算法在不改变时间复杂度量级的前提下对分类精度有显著提高.  相似文献   

6.
阴影集的模糊支持向量机样本选择方法   总被引:1,自引:1,他引:0  
样本选择可以提高模糊支持向量机训练速度并在一定程度上提高其抗噪能力,但存在有效样本选择困难和选样率高的问题,利用阴影集对模糊集的分析能力,提出一种新的基于阴影集的模糊支持向量机样本选择方法,将模糊集合划分为可信任、不可信任及不确定3个子集,仅在可信任和不确定子集中选样,并分别采用子空间样本选择和边界向量提取的方法选样.实验结果表明,该方法在保持分类器泛化能力的前提下可以有效降低选样率和训练时间.因该方法去除了样本中的不可信任数据,所以当训练样本中含有噪声时,还可以有效提高分类器的分类性能.  相似文献   

7.
针对语音特征参数对某类情感具有不确定性的问题,提出一种基于典型相关性分析的改进模糊支持向量机算法,应用于语音情感识别.采用典型相关性分析方法对特征向量进行降维,得到样本的约简向量集,在此约简向量集上建立模糊支持向量机模型判定情感类型.仿真实验结果表明,该方法相比于传统支持向量机法和模糊支持向量‘机法具有较高的识别准确率.  相似文献   

8.
当样本集很大时,训练支持向量机需要很大的内存空间和很长的CPU占用时间.为了减轻支持向量机训练过程中的计算负担,提出一种快速的改进算法,该算法只选择靠近最优超平面的样本.实验结果表明:当训练集很大时,训练时间及预处理的时间都得到了削减,同时,分类精度并没有损失.  相似文献   

9.
提出基于支持向量机的灵敏度分析方法选取结肠癌特征基因.用支持向量机分析基因对分类决策函数的灵敏度,递归去除灵敏度较低的若干基因,得到一组候选特征基因子集;以支持向量机为分类工具,检验候选特征基因子集对样本分类的贡献,选取具有最佳分类能力的候选特征基因子集作为结肠癌特征基因子集.通过实验比较,该特征基因子集的分类能力优于文献给出的其他特征基因子集,表明了该方法的可行性和有效性.  相似文献   

10.
为进一步改善局部支持向量机的分类效率和分类精度,提出一种改进的局部支持向量机算法。该算法对每类训练样本分别进行聚类,使用聚类生成的样本中心点集代替样本,使用改进的k最近邻算法选取测试样本的k个近邻。分别在UCI数据集和自建树皮图像数据集上对本研究算法的有效性进行测试。实验结果表明,本研究提出的算法在分类精度和效率上具有一定的优势。  相似文献   

11.
改进的离散PSO和SVM的特征基因选择算法   总被引:2,自引:0,他引:2  
针对现有的基于粒子群的特征基因选择算法易于陷入局部最优的问题,提出了一种改进的离散粒子群和支持向量机的特征基因选择算法IDPSO-SVM.该算法首先预选一些与分类强相关的基因组成特征基因备选集合,然后基于此集合采用PSO进行寻优搜索,并应用SVM对选出的特征子集的分类能力进行评估,最后得出最优特征子集.该算法加入了一种可以有效克服粒子群在寻优过程中陷入局部最优的机制,因而可以不断探测到新的最优解.该算法在结肠癌与前列腺癌数据集上的分类精度分别达到了96.8%与99.0%,从而证明了其有效性与可行性.  相似文献   

12.
基因表达数据存在高维、小样本、高噪声等特性,使得相应的肿瘤分类诊断面临着一定的挑战。为了实现更加精确的分类准确率,利用人工蜂群(artificial bee colony, ABC)算法对支持向量机(support vector machine, SVM)的核函数参数和惩罚因子进行优化,采用准确率作为分类模型的适应度函数,提出一种基于ABC和SVM的基因表达数据分类方法ABC-SVM。在6种公开的肿瘤基因表达数据集上进行试验,并对比分析其他的分类方法。结果表明,在筛选得到的较少信息基因基础上,ABC-SVM可获得更高的肿瘤分类准确率,对肿瘤样本类型进行更有效的分类预测。  相似文献   

13.
确定肿瘤基因表达谱特征基因方法的研究   总被引:1,自引:0,他引:1  
分析了目前基因表达谱提取特征基因所采用的方法,提出了Fisher权函数和主成份分析结合离散余弦变换的混合特征基因提取方法,以多元Logistic回归分析作为分类器进行肿瘤分类检测。该方法具有以下特点:根据基因表达数据维数高样本量小的特点,使用Fisher权函数对数据进行预处理,简单有效地得到特征基因候选集;利用离散余弦变换(Discrete Cosine Transform,DCT)的能量压缩特性,提高特征基因主成份的显现效果,有效提取特征基因信息。实验结果表明,该方法对结肠癌数据集的CV识别准确率高达95.20%.  相似文献   

14.
肿瘤基因选择方法LLE Score   总被引:1,自引:0,他引:1  
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性.  相似文献   

15.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(5):16-23, 74
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和类样本密度,依据类样本密度之间的关系确定聚类类数, 然后利用K-means聚类算法对多数类样本进行聚类,用聚类所得类中心作为样本集取代原多数类样本集, 最后对新构造的训练集进行训练得到最终决策函数。其实验结果表明,该算法能够提高SVM在不均衡数据下的分类性能,尤其是少数类的分类性能。    相似文献   

16.
不同实验条件下差异表达基因(DEGs)的识别是微阵列数据分析的主要目标之一,针对分析结果中具有高排名的基因往往表现出较低差异表达水平的缺点,提出了一种基于简单统计排名模型的差异表达基因识别算法MRP(Matrix rank product)。算法可直接处理基因芯片原始数据,排除了数据预处理方法对算法的干扰;另外,通过对基因芯片数据形成的矩阵进行整体排序计算,得到具有高准确度的差异表达性排名结果。  相似文献   

17.
通信网络故障预测数据集样本不均衡,影响故障预测的准确性,对此,提出了基于样本均衡与特征交互的通信网络故障预测方法. 首先,将基于Wasserstein距离的梯度惩罚生成对抗网络(WGAN-GP)用于生成新的少数类样本,解决了告警数据集中存在的样本不均衡问题,并提出了嵌入记忆向量的特征生成卷积神经网络(M-FGCNN)模型. 利用多层感知器和卷积神经网络加强特征间的交互,将告警领域专家经验与因子分解机模型结合生成新的告警特征;在模型的嵌入矩阵中加入记忆向量并改进了模型的损失函数,增强了模型的记忆性. 在样本不均衡的公开数据集上进行实验的结果表明,引入WGAN-GP模型的方法比已有的样本均衡方法能生成质量更好的新数据. M-FGCNN模型比其他深度学习模型具有更好的通信网络故障预测性能.  相似文献   

18.
复杂网络控制能够捕获整个网络的状态,使得从海量的蛋白质相互作用数据中找到潜在的肿瘤致病基因成为可能.该文利用复杂网络控制理论探究肿瘤关键基因,对5种癌症相关的蛋白质–蛋白质相互作用网络,通过网络最小控制集方法,选取始终处于最小控制集(minimum dominating set, MDS)的基因作为候选关键基因.利用肿...  相似文献   

19.
提出了一种不依赖于数值数据的重构方法。以从文献中或相关数据库中搜集到的参与同一个信号pathway的各分支的基因组成为样本,在各样本中同时出现的基因一定具有相同调控顺序的前提下,建立一阶Markov链模型,利用EM算法对模型参数进行估计,挖掘出基因间的因果关系进而构建出网络的拓扑结构,弥补了许多重构算法的不足,使预测更具生物学意义。对PKA和MAPK/Erk pathway的重构实验证明了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号