排序方式: 共有10条查询结果,搜索用时 0 毫秒
1
1.
2.
3.
基于聚类的核主成分分析在特征提取中的应用 总被引:10,自引:1,他引:9
本文分析了一般主成分分析在处理非线性问题上的不足,阐述了核主成分分析方法及其计算速度的缺陷,提出了基于聚类的核主成分分析方法。试验结果显示:基于聚类的核主成分分析方法具有好的特征提取性能,相比核主成分分析大大提高了特征提取的速度。 相似文献
4.
SMOTE和Biased-SVM相结合的不平衡数据分类方法 总被引:3,自引:0,他引:3
针时不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased SuIpport Vector Machine,Biased-SVM)相结合的方法.该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类.实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度. 相似文献
5.
基于聚类和改进距离的LLE方法在数据降维中的应用 总被引:1,自引:1,他引:1
局部线性嵌入算法(locally linear embedding, LLE)是解决降维的方法,针对LLE计算速度和近邻点个数K的选取,研究了该方法的扩展,提出了基于聚类和改进距离的LLE方法.基于聚类LLE方法大大缩减了计算LLE方法的时间;改进距离的LLE方法在近邻点个数取值比较小时的情况下,可得到良好的效果,而原始的LLE方法要达到相同的效果,近邻点个数K的取值通常要大很多.同时,改进距离的LLE方法可以模糊近邻点个数选取.实验结果表明,基于聚类和改进距离相结合的LLE方法相比原来的LLE方法大大提高了降维速度和扩大了参数K的选取. 相似文献
6.
针对数据集成过程中存在异常数据的问题,提出了加速度趋势比较清洗方法,即比较数据集成过程中某些字段的变化趋势来发现数据的异常.通过加速度趋势比较清洗,提高了数据集成的异常记录检测,改变了数据集成过程中的数据质量,增强了数据的可利用性.最后给出了具体算法的描述. 相似文献
7.
基于特征的图像检索在多媒体数据库管理和多媒体通信传输中得到越来越多的重视。本文介绍了基于纹理特征的特征提取方法和中心特征的提取方法,并进而提出了一种综合利用上述两个特征共同进行检索的方法。对真实图像库的检索实验表明,综合特征检索比单一特征检索更符合人的视觉特性,检索效果更好。 相似文献
8.
9.
10.
权重润饰和改进的分类对不平衡数据的处理 总被引:1,自引:0,他引:1
王和勇 《计算机应用与软件》2009,26(8):144-146,161
不平衡数据集是指某类样本数量明显少于其它类样本数量的数据集,传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低.针对文本数据的不平衡情况,首先采用权重润饰(Weight-retouching)的方法进行特征提取,然后采用欠取样(Under sampling)的支持向量机SVM(Support Vector Machine)方法进行文本分类.通过实验发现,使用权重润饰和欠取样的SVM方法可以提高处理不平衡数据的分类精度. 相似文献
1