排序方式: 共有46条查询结果,搜索用时 0 毫秒
41.
非平衡数据集分类问题是机器学习领域的重大挑战性难题.针对该难题,传统的少数类样本合成技术(Synthetic Minority Over-Sampling Technique,SMOTE)已成为一种有力手段并得到广泛采用.但在新样本生成过程中,SMOTE利用所有少数类样本合成新样本,由此产生过拟合瓶颈.为更好地解决该问题,提出了一种基于单边选择链和样本分布密度的非平衡数据挖掘新方法(One-Sided Link & Distribution Density-SMOTE,OSLDD-SMOTE).OSLDD-SMOTE通过单边选择链遴选出处于分类边界的少数类样本,根据这些样本的动态分布密度生成新样本.进而分析了样本合成度对节点数目和对少数类精度的影响;基于G-mean、F-measure和AUC三个指标综合比较了OSLDD-SMOTE与其他同类方法的分类性能.实验结果表明,OSLDD-SMOTE有效提高了少数类样本的分类准确率. 相似文献
43.
44.
重复数据删除能够有效地提高存储利用率,现已在备份、归档系统中得到良好应用.然而这种基于比特流的Hash匹配策略对很多应用来说过于严格,例如重复图像删除.为了解决该问题,提出了一种快速精确的图像消冗方法.该方法首先根据Web图像特点给出重复图像定义,然后将图像消冗分为两个阶段.在重复图像发现阶段利用感知Hash等多重过滤技术提高图像检索速度和精度,在重复图像消冗阶段利用模糊逻辑推理选取质心图像以实现消冗.实验结果表明,该方法不仅具有快速、精确的重复图像消冗能力,而且在质心图像的选择上也能满足用户的感知要求. 相似文献
45.