排序方式: 共有43条查询结果,搜索用时 0 毫秒
31.
针对传统的主动学习算法只能处理中小型数据集的问题,提出一种基于MapReduce的大数据主动学习算法。首先,在有类别标签的初始训练集上,用极限学习机(ELM)算法训练一个分类器,并将其输出用软最大化函数变换为一个后验概率分布。然后,将无类别标签的大数据集划分为l个子集,并部署到l个云计算节点上。在每一个节点,用训练出的分类器并行地计算各个子集中样例的信息熵,并选择信息熵大的前q个样例进行类别标注,将标注类别的l×q个样例添加到有类别标签的训练集中。重复以上步骤直到满足预定义的停止条件。在Artificial、Skin、Statlog和Poker 4个数据集上与基于ELM的主动学习算法进行了比较,结果显示,所提算法在4个数据集上均能完成主动样例选择,而基于ELM的主动学习算法只在规模最小的数据集上能完成主动样例选择。实验结果表明,所提算法优于基于极限学习机的主动学习算法。 相似文献
32.
ID3算法是一种典型的决策树归纳算法,它以信息增益作为选择扩展属性根结点的标准,并递归地生成决策树。但ID3算法倾向于选取属性取值较多的属性作为根结点,而且它假设训练集中各类别样例的比例应与实际问题领域里各类别样例的比例相同。提出一种新的基于粗糙集技术的决策树归纳算法,它是一种完全数据驱动的归纳算法,可以克服ID3算法的上述不足。 相似文献
33.
针对大数据K-近邻(K-nearest neighbors, K-NN)计算复杂度高的问题,提出一种基于HBase和SimHash的大数据K-近邻分类算法。利用SimHash算法将大数据集从原空间映射到Hamming空间,得到哈希签名值集合;将样例的行键与值的二元对存储到HBase数据库中,行健(rowkey)为样例的哈希签名值,值(value)为样例的类别;对于测试样例,以其哈希签名值作为健rowkey,从HBase数据库中获取所有样例的value,通过对这些values进行多数投票,即可以得到测试样例的类别。与基于MapReduce的K-NN和基于Spark的K-NN在运行时间和测试精度两方面进行试验比较。试验结果显示,在保持分类能力的前提下,提出的算法的运行时间远远低于其他两种方法。 相似文献
34.
现实世界中存在着大量无类标的数据,如各种医疗图像数据、网页数据等。在大数据时代,这种情况更加突出。标注这些无类标的数据需要付出巨大的代价。主动学习是解决这一问题的有效手段,也是近几年机器学习和数据挖掘领域中的一个研究热点。提出了一种基于在线序列极限学习机的主动学习算法,该算法利用在线序列极限学习机增量学习的特点,可显著提高学习系统的效率。另外,该算法用样例熵作为启发式度量无类标样例的重要性,用K-近邻分类器作为Oracle标注选出的无类标样例的类别。实验结果显示,提出的算法具有学习速度快、标注准确的特点。 相似文献
35.
36.
决策树是常用的数据挖掘方法,扩展属性的选择是决策树归纳的核心问题。基于离散化方法的连续值决策
树归纳在选择扩展属性时,需要度量每一个条件属性的每一个割点的分类不确定性,并通过这些割点的不确定性选择
扩展属性,其计算时间复杂度高。针对这一问题,提出了一种基于相容粗糙集技术的连续值属性决策树归纳方法。该
方法首先利用相容粗糙集技术选择扩展属性,然后找出该属性的最优割点,分割样例集并递归地构建决策树。从理论
上分析了该算法的计算时间复杂度,并在多个数据集上进行了实验。实验结果及对实验结果的统计分析均表明,提出
的方法在计算复杂度和分类精度方面均优于其他相关方法。 相似文献
37.
38.
39.
提出一种基于模糊积分的不完全小波包子空间集成人脸识别方法,并与五种相关方法进行实验比较.首先对人脸图像做不完全小波包分解,对双向低频子空间图像直接进行特征提取,对含有一个方向低频成分的高频子空间图像先求平均,再进行提取特征;然后用得到的不同子空间图像训练模糊分类器;最后用模糊积分融合训练的模糊分类器.该方法能够充分利用不同频率小波子空间图像中包含的有用信息,从而提高人脸识别的精度.在ORL、YALE、JAFFE和FERET这4个人脸数据库上进行实验,实验结果表明该方法在识别精度方面均优于五种相关方法. 相似文献
40.
给定一个模糊信息系统,可能找到多个重要的模糊属性子集,而且这些重要的模糊属性子集对决策有不同的贡献,会产生不同的影响.如果仅选择其中一个模糊属性子集进行决策,即使是最重要的一个,也会丢失隐含在其他重要的模糊属性子集中的可用信息.为了充分利用模糊信息系统中每个重要的模糊属性子集所提供的信息,提出了一种基于模糊积分的多模糊决策树融合方法.这种方法分3个步骤:1)通过模糊等价关系找到几个重要的模糊属性子集;2)对每个模糊属性子集,利用模糊ID3算法生成一棵模糊决策树;3)用模糊积分融合几棵模糊决策树.实验结果证明了用多模糊决策树融合方法比单模糊决策树分类效果更好. 相似文献