排序方式: 共有26条查询结果,搜索用时 15 毫秒
1.
连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发,提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度,而且具有更快的计算速度。 相似文献
2.
基于样本分布特征的核函数选择方法研究 总被引:5,自引:0,他引:5
核函数选择是支持向量机研究的热点和难点。目前大多数核函数选择方法主要应用验证方法选择,很少考虑数据的分布特征,没有充分利用隐含在数据中的信息。为此提出了一种应用样本分布特征的核函数选择方法,即先行分析样本分布特征,然后结合核函数蕴含的几何度量选择合适的核函数,使非线性样本映射得到的特征空间线性可分性得到提高,增强可分性和预测能力。仿真结果证明,提出的方法对支持向量机核函数选择能提供有效的指导,且对泛化能力也得到提高,方案具有可行性和有效性。 相似文献
3.
与经典的K均值聚类算法相比,模糊C均值(FCM)聚类算法通过引入模糊因子,考虑不同聚类数据簇之间的相互关系,得到可分性更好的聚类结果。但是模糊因子的引入,使得任意一个样本点都存在模糊性,造成FCM极易受到噪声和离群点的影响,聚类结果泛化性能较差。因此,该文提出一种簇间可分的鲁棒FCM算法(RBI-FCM)。RBI-FCM利用K均值算法对模糊隶属度的稀疏特征,降低不同数据簇之间的相互作用,突出不同数据簇相邻区域的可分性;另外,RBI-FCM在极小化数据簇内部散布度的条件下,考虑不同数据簇之间的可分性,可提高聚类模型的泛化性能。该文设计了有效的模型求解迭代算法。实验结果表明,RBI-FCM算法提高了FCM的鲁棒性,有效降低FCM对数据簇分布差异性和抽样不均衡的敏感性,得到理想的聚类结果。
相似文献4.
目的以光谱图像作为检测样本讨论不同训练样本数量、分布对光谱图像重构的影响。方法选择ColorCheckerSG(140色)和ColorCheckerColorRenditionChart(24色)以及Munsell(1269色)等3种色卡作为训练样本,对其光谱反射率进行主成分分析,利用提取的主成分对光谱图像进行重构。结果采用ColorChecker Color Rendition Chart(24色)色卡的7个主成分重构光谱图像对图像的再现精度最高,其色差比其他2种色卡小,且最大色差小于3。结论在同一重构条件下,光谱图像的重构精度并不随着训练样本数量增多以及分布范围增大而提高,3种训练样本对红紫色的重构精度相对较低。 相似文献
5.
以水泥实验室常用样本分布特征值为例,运用Excel进行数据分析的辅助计算,显示了Excel运算迅速,准确的优点。 相似文献
6.
一种更有效的K-means聚类算法 总被引:1,自引:0,他引:1
一个好的聚类算法不仅要考虑“同类内尽可能的相似,不同类间尽可能的相异”,而且也要考虑算法的时间复杂度。针对K-means算法依赖于初始聚类中心而影响聚类结果,提出了一种基于样本分布选取初始聚类中心的方法;针对K-means算法中每次调整聚类中心后指定聚类所需要的大量的距离计算,提出了三角不等式原理避免冗余计算的方法。将两种方法结合进行实验,结果表明新的方法更加有效,不仅较原算法有良好的聚类划分,而且加快了原算法的运行速度。 相似文献
7.
8.
《计算机应用与软件》2016,(9)
评价标准是分类器的重要指标。对于多标签学习,常用的评价标准有Hamming Loss、One-error、Coverage、Ranking loss和Average precision。多标签分类器给出分类结果的同时并未给出评价标准值,通常采用事后验算的方法评估评价标准。这样往往不能及时有效地发现评价标准值变化之类的问题,同时评估评价标准值需对测试样本进行标记。针对这一问题,分别从样本分布差异和样本实例间差异提出两种评价标准预估方法。分析上述两种方法的特点,提出第三种评价标准预估方法。实验表明,这三种评价标准预估方法具有良好效果,可用于迁移学习等。 相似文献
9.
近年来,应用DNA微阵列技术对疾病,尤其是癌症进行诊断,已逐渐成为生物信息学领域的研究热点之一。对比其它的数据载体,微阵列数据通常具有一些独有的特点。针对微阵列数据样本分布不平衡这一特点,提出了一种基于概率分布的过采样技术,通过该技术可以为少数类建立一些合理的伪样本,从而使各类的样本数达到均衡,然后使用随机森林分类器对其进行分类。该方法的有效性和可行性已经在两个标准的微阵列数据集上得到了验证。实验结果显示,与传统的方法相比,该方法可以获得更好的分类性能。 相似文献
10.
遗传算法在模糊图像恢复的应用上,如果算法设计的不合理,需要更多的迭代次数,影响算法本身的运行效率,也有可能会陷入局部收敛,影响图像恢复的效果.针对现有的遗传算法.结合图像本身的特点,提出了一种新的图像模糊恢复的遗传算法结构.该算法以二维的染色体编码方式,通过样本分布模板和多重随机参数,以提高迭代收敛的速度,同时避免局部收敛.实验结果表明,该算法在运动模糊图像的恢复中,要优于传统的逆滤波法,算法的抗噪声能力较强,对于运动参数估计的依赖性也较弱. 相似文献