排序方式: 共有26条查询结果,搜索用时 265 毫秒
1.
以水泥实验室常用样本分布特征值为例,运用Excel进行数据分析的辅助计算,显示了Excel运算迅速,准确的优点。 相似文献
2.
与经典的K均值聚类算法相比,模糊C均值(FCM)聚类算法通过引入模糊因子,考虑不同聚类数据簇之间的相互关系,得到可分性更好的聚类结果。但是模糊因子的引入,使得任意一个样本点都存在模糊性,造成FCM极易受到噪声和离群点的影响,聚类结果泛化性能较差。因此,该文提出一种簇间可分的鲁棒FCM算法(RBI-FCM)。RBI-FCM利用K均值算法对模糊隶属度的稀疏特征,降低不同数据簇之间的相互作用,突出不同数据簇相邻区域的可分性;另外,RBI-FCM在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,可提高聚类模型的泛化性能。该文设计了有效的模型求解迭代算法。实验结果表明,RBI-FCM算法提高了FCM的鲁棒性,有效降低FCM对数据簇分布差异性和抽样不均衡的敏感性,得到理想的聚类结果。 相似文献
3.
连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发,提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度,而且具有更快的计算速度。 相似文献
4.
5.
样本特征对光谱图像重构影响的研究 总被引:6,自引:6,他引:0
目的以光谱图像作为检测样本讨论不同训练样本数量、分布对光谱图像重构的影响。方法选择ColorCheckerSG(140色)和ColorCheckerColorRenditionChart(24色)以及Munsell(1269色)等3种色卡作为训练样本,对其光谱反射率进行主成分分析,利用提取的主成分对光谱图像进行重构。结果采用ColorChecker Color Rendition Chart(24色)色卡的7个主成分重构光谱图像对图像的再现精度最高,其色差比其他2种色卡小,且最大色差小于3。结论在同一重构条件下,光谱图像的重构精度并不随着训练样本数量增多以及分布范围增大而提高,3种训练样本对红紫色的重构精度相对较低。 相似文献
6.
《计算机应用与软件》2016,(9)
评价标准是分类器的重要指标。对于多标签学习,常用的评价标准有Hamming Loss、One-error、Coverage、Ranking loss和Average precision。多标签分类器给出分类结果的同时并未给出评价标准值,通常采用事后验算的方法评估评价标准。这样往往不能及时有效地发现评价标准值变化之类的问题,同时评估评价标准值需对测试样本进行标记。针对这一问题,分别从样本分布差异和样本实例间差异提出两种评价标准预估方法。分析上述两种方法的特点,提出第三种评价标准预估方法。实验表明,这三种评价标准预估方法具有良好效果,可用于迁移学习等。 相似文献
7.
基于改进支持向量机的客户流失分析研究 总被引:14,自引:0,他引:14
针对客户关系管理中的客户流失问题,建立了基于支持向量机的预测模型.基于实际客户流失数据样本数据量大、正负样本分布不平衡的特点,提出了一种改进支持向量机算法,并将其用于电信行业的客户流失预测.通过实际电信客户数据集测试,与传统的预测算法比较,证明这种算法适合解决大数据集和不平衡数据,具有更高的精确度. 相似文献
8.
一种更有效的K-means聚类算法 总被引:1,自引:0,他引:1
一个好的聚类算法不仅要考虑“同类内尽可能的相似,不同类间尽可能的相异”,而且也要考虑算法的时间复杂度。针对K-means算法依赖于初始聚类中心而影响聚类结果,提出了一种基于样本分布选取初始聚类中心的方法;针对K-means算法中每次调整聚类中心后指定聚类所需要的大量的距离计算,提出了三角不等式原理避免冗余计算的方法。将两种方法结合进行实验,结果表明新的方法更加有效,不仅较原算法有良好的聚类划分,而且加快了原算法的运行速度。 相似文献
9.
10.
当两类样本分布存在差异时,最接近支持向量机(Proximal Support Vector Machine,PSVM)等最小二乘类分类器分类结果将出现偏差,不能实现最小错误率分类。本文在分析PSVM等价广义特征值分解模型基础上,提出了一种改善原PSVM分类决策面的优化样本分布PSVM,其基本思想是通过引入最大化正确分类样本距决策面距离,同时最小化错误分类样本距决策面距离的优化样本分布正则化项,构造优化样本分布PSVM的广义特征值分解模型。通过人工数据集和UCI数据集的10个数据子集上的对比实验,验证了该改进分类模型能够有效调整决策边界,从而获得更好的分类效果。 相似文献