共查询到19条相似文献,搜索用时 171 毫秒
1.
4.
针对目前概率机器学习方法在解决概率问题时具有较高的复杂度,而传统的支持向量数据描述(SVDD)作为一种核密度估计方法只能判断测试样本是否属于该类等问题,提出一种基于概率的支持向量数据描述方法。首先,利用传统的SVDD方法分别得到两类数据的数据描述,计算测试样本到超球体的距离;然后,构造一个将距离转换为概率的函数,提出一种基于概率的SVDD方法;同时,使用Bagging算法进行集成,进一步提高数据描述的性能。借鉴分类场景,将所提方法与传统的SVDD方法在Gunnar Raetsch的13种基准数据集上进行实验,实验结果表明,所提方法在准确率和F1值上优于传统的SVDD方法,并且其数据描述的性能有所提升。 相似文献
5.
为改善传统的基因表达数据聚类方法正确率偏低的问题,研究了支持向量数据描述(SVDD)算法在基因表达数据聚类中的应用,该方法通过寻找最优分类超球实现对数据集的有效聚类.将类间信息融入聚类有效性评估准则中,通过模拟退火优化算法寻找SVDD算法中的最优核函数参数和惩罚因子,在训练时引入非样本数据提高运算效率.对酵母细胞生长周期的基因表达数据集的仿真实验结果表明,在新的聚类有效性评估准则下进行参数寻优,能够更快更好地得到最佳参数,同时,算法具有聚类精度高和运算速度快的优点. 相似文献
6.
7.
8.
基于信息熵的支持向量数据描述分类 总被引:1,自引:0,他引:1
针对现有的支持向量数据描述(SVDD)在解决分类问题时通常存在盲目性和有偏性,在研究信息熵和SVDD分类理论的基础上,提出了改进两类分类问题的E-SVDD算法。首先对两类样本数据分别求出其熵值;然后根据熵值大小决定将哪类放在球内;最后结合两类样本容量以及各自的熵值所提供的分布信息,对SVDD算法中的C值重新进行定义。采用该算法对人工样本集和UCI数据集进行实验,实验结果验证了算法的可行性和有效性。 相似文献
9.
10.
针对现有支持向量数据描述(SVDD)快速决策方法在检测不同分布特性的未知样本时分类精度低下的问题,提出基于超椭球分类面的SVDD(HE-SVDD)快速决策方法.该方法通过构建超椭球分类面,提高了不同分布类型数据的分类精度,同时将SVDD的决策复杂度从$O(n)$降低到O(2)(n为支持向量数量).首先研究超球分类面快速决策方法的局限性,进而给出超椭球分类面的构建方法.在多种数据集上的实验结果表明,HE-SVDD可以在很大程度上提升现有快速决策方法的分类精度和适用数据类型. 相似文献
11.
K-means聚类与SVDD结合的新的分类算法* 总被引:2,自引:1,他引:1
为了提高支持向量数据描述(SVDD)的分类精度,引入局部疏密度提出了改进的SVDD算法。该算法提高了分类精度,但增加了计算复杂度。为此,先用K-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。由于采用了分而治之并行计算的方法,提高了算法的效率。对合成数据(200个)和实际数据的实验结果表明,所提算法较SVDD算法,训练时间降低为原来的10%,分类错误率较原来的降低了近一半。因此,所提算法提高了分类精度和算法效率。 相似文献
12.
为了保障设备稳定可靠运行,减少设备故障,针对大多数设备采集样本不均衡的现状,提出了利用动态权重的支持向量数据描述(SVDD)方法对设备健康度进行评估。该方法首先利用设备正常健康数据进行SVDD单类学习;然后利用少量各种健康状态的数据样本计算SVDD模型超球面距离,结合其评估的健康度,使用二项式回归算法得到健康度拟合曲线,实现了健康度准确评估模型。在计算过程中,所有样本进行了指数变权的动态权重处理以提高准确性。最后以某型雷达发射机为例进行了测试验证。结果表明,该方法可实现设备健康状态准确评估,具有不错的实用价值。 相似文献
14.
针对支持向量数据描述(SVDD)单类分类方法运算复杂度高的缺点,提出一种启发式约减支持向量数据描述(HR-SVDD)方法。以启发的方式从原有训练集中筛选出部分样本构成约减训练集,对约减训练集进行二次规划解算,得到支持向量和决策边界。通过不同宽度系数高斯核SVDD特征的讨论,证明了HR-SVDD的有效性。人工数据集和真实数据集上的实验结果表明, HR-SVDD分类精度与传统支持向量数据描述相当,但具有更快的运算速度和更小的内存占用。 相似文献
15.
16.
针对现有数据流模式变化检测算法存在对离群点和噪声敏感等缺点,提出一种基于动态SVDD的数据流模式变化鲁棒检测算法。该算法不需要先验知识,通过建立子序列映像的最小超球体模型以排除离群点及减小噪声的影响。仿真实验验证了算法的有效性。 相似文献
17.
支持向量数据描述(SVDD)是构造单类数据描述的分类算法,惩罚参数[C]和核参数[σ]作为影响SVDD分类效果的关键,其合理选取一直是个难点。针对这一问题,提出了一种基于改进磷虾群算法的SVDD参数优化算法(IKH-SVDD)。依据仿真实验,分析参数[C]和[σ]对描述边界的影响;引入磷虾群算法并分析其优劣,通过在随机扩散行为中定义扰动因子,增强算法的全局搜索能力;将一种新的精英选择和保留策略引入迭代过程,提高算法的收敛精度;将改进的磷虾群算法引入SVDD参数优化过程,构建了IKH-SVDD参数优化模型。基于UCI标准数据库进行实验并与其他几种参数优化算法进行比较,结果表明了IKH-SVDD算法具有更高的分类准确性。 相似文献
18.
19.
基于样本投影分布的平衡不平衡数据集分类* 总被引:2,自引:0,他引:2
提出一种平衡不平衡数据集统一分类方法,首先得到训练样本基于支持向量机(SVM)超平面法线方向上的投影;再借助支持向量数据描述(SVDD)对训练样本投影分布进行描述;测试样本在此基础上实现分类。平衡或不平衡数据集都可采用相同的方法进行分类。实验表明该方法能够同时对平衡或不平衡数据集进行有效的分类。 相似文献