首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
一种基于微阵列数据的集成分类方法*   总被引:1,自引:0,他引:1  
针对现有的微阵列数据集成分类方法分类精度不高这一问题,提出了一种Bagging-PCA-SVM方法。该方法首先采用Bootstrap技术对训练样本集重复取样,构成大量训练样本子集,然后在每个子集上进行特征选择和主成分分析以消除噪声基因与冗余基因;最后利用支持向量机作为分类器,采用多数投票的方法预测样本的类属。通过三个数据集进行了测试,测试结果表明了该方法的有效性和可行性。  相似文献   

2.
周鹏 《计算机工程与设计》2005,26(11):2966-2968,2974
基于DNA微阵列实验,可以同时观测成千上万个基因的表达水平,使得人们能够在基因组水平上以系统的、全局的观念去研究生命现象及本质。支持向量机作为一种新的机器学习方法,最近几年在生物信息学领域得到了广泛的研究,在许多情况下,支持向量机取得了优于或接近其它方法的性能。就支持向量机在DNA微阵列的应用做一综述。  相似文献   

3.
基于支持向量机的微阵列基因表达数据分析方法   总被引:5,自引:0,他引:5  
DNA微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于支持向量机的基因表达数据分类识别方法,该方法采用信噪比进行基因特征提取,运用支持向量机的不同核函数进行性能测试,针对几个典型数据集的实验表明其识别效果良好.  相似文献   

4.
基于微阵列表达数据,探索新的有效特征提取和分类方法。采用小波多分辩率分析方法提取基因表达的特征,利用支持向量机和BP神经网络方法进行分类。基因表达具有明显的多尺度特征,分类率最大达到98.61%,结果稳定。采用多尺度理论对基因表达数据进行分析是一种新的有效的生物信息学方法,值得进一步探索与研究。  相似文献   

5.
基于相关性分析的微阵列数据集成分类研究   总被引:1,自引:0,他引:1  
基于微阵列数据的肿瘤诊断方法有望在不久的将来成为临床医学上一种快速且有效的分子层肿瘤诊断方法,但由于微阵列数据存在高维小样本的特点,因而对传统的分类方法提出了挑战,为此研究人员开始关注于性能更好的集成分类算法.针对现有的微阵列数据集成分类算法分类精度不高、计算量过大等问题,提出了一种基于相关性分析的微阵列数据集成分类算法.该算法可以通过计算训练子集间的相关性挑选出差异度最大的一组子集来进行训练,有效地增强了集成中的多样性.应用支持向量机作为基分类器,在急性白血病与结肠癌数据集上的实验结果表明了所提算法的有效性和可行性.同时,测试了算法在不同参数设置下的性能,测试结果为合理的参数设置提供了参考依据.  相似文献   

6.
基于ICA与聚类分析的支持向量机分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
在ICA与聚类分析的基础上提出了一种改进的支持向量机分类模型——ICSVM模型。ICSVM模型中利用一种指标筛选算法与独立成分分析的方法将各数据指标转化为互相独立成分的数据指标。接着运用K-means方法对独立成分样本数据集进行聚类分析,再由获得的各子类中心数据构造初始的超平面,筛选出靠近初始超平面的支持类与亚支持类,并展开支持类与亚支持类中的样本数据点重新构造超平面,以便对数据进行分类。实验表明,对于样本比较多的数据集,与标准的SVM算法相比,ICSVM算法能够节约训练时间,同时能够提高分类的正确率。  相似文献   

7.
SVM在基因微阵列癌症数据分类中的应用   总被引:1,自引:0,他引:1  
在总结二分类支持向量机应用的基础上,提出了利用t-验证方法和Wilcoxon验证方法进行特征选取,以支持向量机(SVM)为分类器,针对基因微阵列癌症数据进行分析的新方法,通过对白血病数据集和结肠癌数据集的分类实验,证明提出的方法不但识别率高,而且需要选取的特征子集小,分类速度快,提高了分类的准确性与分类速度。  相似文献   

8.
基于PCA与ICA特征提取的入侵检测集成分类系统   总被引:10,自引:0,他引:10  
入侵检测系统不仅要具备良好的入侵检测性能,同时对新的入侵行为要有良好的增量式学习能力.提出了一种入侵检测集成分类系统,将主成分分析(PCA)和独立成分分析(ICA)与增量式支持向量机分类算法相结合构造两个子分类器,采用集成技术对子分类器进行集成.系统利用支持向量集合对已有的入侵知识进行压缩表示,并采用遗传算法自适应地调整集成分类系统的权重.数值实验表明:集成分类系统通过自适应训练权重,综合了两种特征提取子分类器的优点,具有更好的综合性能.  相似文献   

9.
文本分类的特征提取方法比较与改进   总被引:12,自引:0,他引:12  
文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的χ2统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进。为了对这些特征提取方法进行系统地比较,选择了三种代表性的分类器对《读卖新闻》文本数据库进行了分类实验。实验结果表明χ2统计方法具有最好的准确率,各种改进的特征提取方法都能提高文本分类的准确率。  相似文献   

10.
基于DNA微阵列基因表达数据的分类方法研究   总被引:1,自引:1,他引:0  
介绍了目前几种基于DNA微阵列基因表达数据的分类方法。分别阐述了递归分割法、构建森林法以及信息融合方法的算法思想,对每种方法进行了深入描述,并对它们进行了分析和比较。最后对基于基因表达微阵列数据的分类技术进行了展望。  相似文献   

11.
ICA结合纹理特征的SVM盐渍化信息提取研究   总被引:1,自引:0,他引:1       下载免费PDF全文
以渭干河-库车河三角洲绿洲为例,利用ETM+数据,探讨了该绿洲盐渍化土地覆盖信息的提取方法。提出了基于ICA与纹理特征的SVM复合的分类方法(简称ICA-T-SVM法),通过此方法对该绿洲进行分类研究,并将分类结果与基于ICA的SVM法(简称ICA-SVM)、单源数据(光谱)SVM法、最大似然法(MLC)、神经网络法(Neural Network)分类结果进行定性和定量比较分析。研究结果表明:该方法能够有效地解决单数据源分类效果破碎、分类精度不高等问题,并对高纬输入向量具有较高的推广能力。总精度达到93.418 3%,比基于ICA的SVM法提高了3.412 3%,比单源信息的SVM分类法提高了3.423 7%,比最大似然法提高了4.979 6%,比神经网络法提高了7.714 4%,取得了良好的效果。与传统的分类方法的比较表明,文中所提出的分类方法具有明显的优越性和良好的前景,因此该方法更适合于遥感图像分类和盐渍化信息提取,是地物遥感信息提取的有效途径。  相似文献   

12.
提出总间隔v最小类内方差支持向量机(TM-v-MCVSVMs),用于解决含有噪音人脸图像的分类问题,它综合了最小类内方差支持向量机(MCVSVMs)和总间隔v-支持向量机(TM-v-SVM)的优点。给出了TM-v-MCVSVMs在小样本问题和非线性分类问题中的解决方法。经初步的实验验证,在含有噪音人脸图像的分类问题中,TM-v-MCVSVMs获得了比MCVSVMs和TM-v-SVM更好的分类性能。  相似文献   

13.
ICA是应用于盲源信号分离的一种统计方法。利用ICA对基因微阵列表达谱数据进行分解获得由基因模型谱和对应系数构成的线性谱模型,并在此基础上进行基因分类。由于基于ICA的一个模型谱并不能完整地代表一个具有生物意义的类别,并且模型谱之间不具正交性,在此线性模型下不能有效的表示基因数据,为此提出基于ICA的模式表达空间的概念,并在该模式空间中重新构造了基因的数据表达形式,并利用此表达形式进行基因分类。实验结果表明,该分类方法比线性谱模型下的基因分类具有更高的正确率。  相似文献   

14.
协同训练可以提高半监督分类器的分类精度,而如何构建具有冗余特性的训练集是其关键所在。依据遥感影像的纹理特征,提出了基于纹理特征值及像素灰度值构建的两个训练集上协同训练支持向量机的算法CTSVMTRS。仿真实验比较了在不同训练集上CTSVMTRS的分类效果,在叠代训练过程中,两类数据集的所有过程的测试结果都存在的明显差异验证了提出的观念。  相似文献   

15.
基于支持向量机的思维脑电信号特征分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
探索一种实用的基于想象运动思维脑电的脑-机接口(BCI)方式,为实现BCI应用奠定比较坚实的理论和实验基础。对6名受试者进行三种不同时段(箭头出现2s、1s和0s后提示按键)情况下想象左右手运动思维作业的信号采集实验,利用小波变换和支持向量机对实验数据进行离线处理。对三种情况下的延缓时间△t0、△t1和△t2分析发现:△t0与△t1和△t2之间都有显著性差别(p<0.05),而△t1与△t2之间没有显著差别(p>0.05);平均分类正确率分别达到68.00%、80.00%和56.67%(p<0.05);实际按键前0.5~1s左右,想象左右手运动的思维脑电特征信号都发生了明显改变。通过合理的实验设计获取的信号有助于识别正确率的提高,为BCI系统中思维任务的特征提取与识别分类提供了新思路和方法。  相似文献   

16.
基于遗传算法的结肠癌基因选择与样本分类   总被引:2,自引:1,他引:1       下载免费PDF全文
提出了一种基于两轮遗传算法的用于结肠癌微阵列数据基因选择与样本分类的新方法。该方法先根据基因的Bhattacharyya距离指标过滤大部分与分类不相关的基因,而后使用结合了遗传算法和CFS(Correlation-based Feature Selection)的GA/CFS方法选择优秀基因子集,并存档记录这些子集。根据存档子集中基因被选择的频率选择进一步搜索的候选子集,最后以结合了遗传算法和SVM的GA/SVM从候选基因子集中选择分类特征子集。把这种GA/CFS-GA/SVM方法应用到结肠癌微阵列数据,实验结果及与文献的比较表明了该方法效果良好。  相似文献   

17.
针对脑-机接口的特征提取问题,提出了一种基于非监督学习的稀疏降噪自编码器,对刺激诱发的脑电信号进行自主学习,构建原始数据的深层特征表达。该编码器引用稀疏自编码神经网络,通过加入噪声,增强其学习的泛化能力,增加了神经网络的鲁棒性。首先对多导联信号进行重新拼接,输入稀疏降噪自编码器,得到原始数据的稀疏特征表达;然后,采用支持向量机将学习到的特征进行分类;最后,同直接使用最优单通道相对比。实验结果为:稀疏降噪自编码器的分类准确率要优于单通道,表明该方法能够更好地学习到特征,并提高了“模拟阅读”脑-机接口的识别正确率,为脑-机接口系统的特征提取和分类提供了新思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号