共查询到20条相似文献,搜索用时 203 毫秒
1.
粗糙决策支持方法是一组用于决策支持的粗糙分析方法,该方法能够充分挖掘决策表的决策能力,以提供强有力的决策支持,并且本质上提供容错的决策支持,条件向量约简是这一方法的重要研究内容。论文以决策强度、条件向量的覆盖度和属性的重要性为启发式信息,提出了条件向量约简的一种启发式算法,通过实验验证了该算法是有效的。 相似文献
2.
3.
4.
当前的网页重复信息抽取方法缺少信息分类步骤,导致传统方法存在抽取全面率低、重复信息比例高以及整体性能差的问题。于是提出基于模式识别算法的网页重复信息抽取方法。利用类间平衡因子和词频获取网页信息的互信息特征。在关联规则的基础上根据网页置信度向量化互信息特征,完成网页信息特征的提取。利用模式识别中的支持向量机对网页信息分类,优化惩罚函数,建立软间隔支持向量机分类器。计算不同类别网页信息的结构相似度和语义相似度,结合上述计算结果获得网页信息相似性,完成网页重复信息的抽取。仿真结果表明,所提方法的抽取全面率高、重复信息比例低,且整体应用性能好,实验结果表明所提方法具有理想的应用效果。 相似文献
5.
支持向量机是一种具有完备统计学习理论基础和出色学习性能的新型机器学习方法,它能够较好地克服过学习和泛化能力低等缺陷.但是在利用支持向量机的分类算法处理实际问题时,该算法的计算速度较慢、处理问题效率较低.文中介绍了一种新的学习算法粗SVM分类方法,就是将粗糙集和支持向量机相结合,利用粗糙集对支持向量机的训练样本进行预处理,通过属性约简方法以减少属性个数,且在属性约简过程中选出几组合适的属性集组成新的属性集,使模型具有一定的抗信息丢失能力,同时充分利用SCM的良好推广性能,从而缩短样本的训练时间,实现快速故障诊断.对航空发动机故障诊断的实验结果表明了该方法的优越性. 型机器学习方法,它能够较好地克服过学习和泛化能力低等缺陷.但是在利用支持向量机的分类算法处理实际问题时,该算法的计算速度较慢、处理问题效率较低.文中介绍了一种新的学习算法粗SVM分类方法,就是将粗糙集和支持向量机相结合,利用粗糙集对支持向量机的训练样本进行预处理,通过属性约简方法以减少属性个数,且在属性约筒过程中选出几组合适的属性集组成新的属性集,使模型具有一定的抗信息丢失能力,同时充分利用SCM的良好推广性能,从而缩短样本的训练时间,实现快速故障诊 .对航空发动机故障诊断的实验结果表明了该方法的优越性. 型机器学习方法 相似文献
6.
蒋桂莲 《计算机与数字工程》2010,38(6):138-141
人脸识别方法易受光照、姿态和表情变化的影响,针对这一问题,提出了一种基于Gabor小波和粗糙集属性约简的人脸识别方法。该方法先对人脸图像进行Gabor小波变换,将小波变换的系数作为人脸图像的特征向量;然后结合信息论中信息熵与互信息的概念定义了粗糙集里的一种新的属性重要度,并以此属性重要度为启发式信息进行约简数据集,从而对所得的人脸图像特征进行降维,并采用支持向量机进行分类。实验结果表明,该算法降低了支持向量机分类器的复杂度,有较好的识别性能。 相似文献
7.
基于粗糙集与支持向量机的故障智能分类方法 总被引:5,自引:0,他引:5
结合粗糙集的属性约简与支持向量机的分类功能,提出一种应用粗糙集与支持向量机的故障分类方法。该方法应用粗糙集理论属性约简作为诊断数据预处理器,可将冗余属性从诊断决策表中删除,而不损失有效信息,然后基于支持向量机进行故障分类建模和预测。谊方法可降低故障诊断数据维数及支持向量机在故障分类过程中的复杂度,但不会降低分类性能。将方法应用于某柴油机故障诊断数据的测试分类,结果表明该方法可快速正确的从数据获得故障类剐。 相似文献
8.
一种基于粗糙集和支持向量机的混合分类算法 总被引:5,自引:0,他引:5
结合粗糙集的属性约简和支持向量机的分类机理,提出了一种混合算法。应用粗糙集理论的属性约简过程作为预处理器,可以把冗余的属性和冲突的对象从决策表中删去,但不损失任何有效信息;然后基于支持向量机进行分类建模和预测。这样可以大大降低数据维数,降低支持向量机分类过程中的复杂度,减少占用的存储空间,并在不同程度上避免了训练模型的过拟合现象,但分类性能并不会隆低.最后的仿真实例说明了所提方法的有效性. 相似文献
9.
中文网页文本分类面临着高维的属性空间问题,传统的属性约简方法存在损失有用信息的缺陷,影响了分类结果。提出粗糙集与支持向量机结合的方法,在降低属性空间维数的同时,保持了原有属性集的分类能力。同时实现了用主成分分析,奇异值分解方法降维与支持向量机分类相结合的分类器。结果表明,该方法降维能力最强、分类时间最短、分类效果最佳。 相似文献
10.
直推式支持向量机是一种直接从已知样本出发对特定的未知样本进行识别的分类技术。在分析直推式支持向量机分类原理的基础上,提出一种基于直推式支持向量机的Web信息抽取方法,直接从分类的角度抽取Web信息。只需要提供少量标记样本就可以实现对大量未标注样本的分类标注,从而以分类的方式完成Web数据抽取任务。实验结果表明,使用这种方法进行Web信息抽取是有效性。 相似文献
11.
针对目前蛋白质交互(PPI)关系提取方法仅以单句中的信息为主要依据的问题,提出一种基于大规模文本的蛋白质交互关系自动提取的方法.首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,将蛋白质交互关系抽取转化为文本自动分类问题;然后提取签名档中的重要特征,建立蛋白质对的向量空间模型(VSM);最后采用支持向量机(SVM)对签名档进行分类.比较了四种对向量的特征进行加权和特征选择的方案.实验表明,基于大规模文本的蛋白质交互关系识别取得了最高达94.8%的精确度和65.1%的召回率;并且此方法充分利用已有的交互信息,免除了额外的人工标注的负担. 相似文献
12.
最小类方差支持向量机(MCVSVM)充分考虑数据的分布信息,但是在小样本情况下却仅利用类内散度矩阵非零空间中的信息。为了综合利用类内散度矩阵非零空间和零空间中的信息来进一步提高分类性能,文中首先在零空间中建立一种分类器——零空间分类器(NSC),然后再把MCVSVM和NSC进行融合,从而进一步提出集成分类器(EC)。不同于MCVSVM和NSC,EC综合考虑非零空间和零空间中的信息,体现出更强的泛化能力。最后通过实验验证算法的有效性。 相似文献
13.
针对遗传算法(GA)与支持向量机(SVM)集成相结合的疾病诊断方法存在属性冗余的问题,提出了一种改进的约简和诊断乳腺癌决策方法。该方法将最小化约简属性个数、最大化区分矩阵可区别属性的个数以及最大化约简属性对决策属性的依赖度这三种目标函数相结合作为GA的适应度函数。在约简属性后取多个子集,以便利用SVM集成学习。在UCI数据库中乳腺癌数据集的实验表明,与原始的SVM算法相比,该方法在分类诊断的准确度以及敏感性方面有一定的提高,其中分类准确度至少提高了2%。 相似文献
14.
15.
16.
1.引言特征属性选择(feature attribute selection,FAS)是机器学习和模式识别中比较困难而又非常有意义的一个问题。FAS问题是从一个大的侯选属性集合中选择一个较好的、有代表性的属性子集。由于在实际应用中,过多的属性会严重影响归纳学习的质量,一些不必要的属性会加大训练数据量,影响学习速度,损害所生成规则的精度,因此FAS是一个有实际意义的问题。 相似文献
17.
该文提出了一种基于偏最小二乘(PLS)的支持向量机(SVM)多分类方法,该算法利用偏最小二乘思想对样本进行预处理,消除了样本属性之间的相关性,而且得到的综合属性与类信息的相关程度达到最大。通过实验可以看出,该方法不仅可以减少用支持向量机进行分类过程中的支持向量数目,而且当样本属性较多时,可以提高一定的识别率。 相似文献
18.
特征选择是邮件过滤重要的环节,特征的好坏不仅影响分类的准确率,还直接影响到分类器训练和分类的开销。比较了常用的CHI选择、互信息(MI)、信息增益(IG)和SVM 特征选择算法在垃圾邮件过滤中的效果,针对这些方法只排序而未消除特征间冗余的缺点,提出了利用特征词间条件概率和分类区分度消除冗余的混合邮件特征选择方法。实验结果表明:方法效果良好,提高了邮件分类准确率。 相似文献
19.
基于模糊粗糙集信息熵的蚁群特征选择方法 总被引:1,自引:0,他引:1
目前针对高维数据特征选择提出的启发式算法多数容易陷入局部最优,无法对整个特征空间进行有效搜索。为了提高对特征域的并行搜索能力,基于模糊粗糙集的信息熵原理,对蚁群模型的搜索策略、信息素更新和状态转移规则等进行了改进,提出蚁群特征选择方法。经UCI数据实验验证,该算法比传统的特征选择算法具有更好的选择效果,是有效的。 相似文献