首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对不确定性数据的分类问题,提出一种基于直方图估计的不确定性朴素贝叶斯分类器(HU-NBC).基于直方图估计的思想,建立估计不确定性数据概率密度函数的数学模型,并利用该模型估计不确定性朴素贝叶斯分类器的类条件概率密度函数.实验结果表明,与同类型算法相比,基于直方图估计的HU-NBC算法拥有较优的分类精度、较小的时间代价和空间需求,适合解决数据量较大的不确定性数据分类问题.  相似文献   

2.
决策树算法是数据挖掘中重要的分类算法,但目前多数针对决策树的改进方法都基于传统的串行算法,不能满足大数据环境下对海量数据挖掘的需要.针对大数据集中串行挖掘算法效率低下的问题,采用MapReduce对决策树算法进行了并行化实现,同时引入修正参数来改进ID3算法倾向于多值属性选取的问题.实验结果表明,该算法具有较好的并行性和扩展性,能有效处理大数据集的分类问题.  相似文献   

3.
为了减少不确定性数据集的不确定性,清除不确定性数据集中的脏数据,研究了在聚集约束条件下的不确定性数据清洗的问题.分析了现有的基于聚集约束的不确定性数据清洗模型和方法的不足,对文献[4]中的目标函数模型进行了完善;同时,借鉴改进的非常快速模拟退火(MVFSA)算法的思想,设计了新的聚集约束下的不确定性数据清洗算法.实验结果表明,新算法不仅在求解质量上有所改进,而且求解效率得到较大提高.  相似文献   

4.
针对高维、小样本及不确定性的基因表达数据,融合模糊可容忍性的邻域粒化技术与具有全局寻优能力的鱼群智能算法,提出基于邻域粗糙集与鱼群智能的基因选择方法。首先,采用邻域粗糙集对基因数据进行邻域粒化,形成邻域粒子;其次,提出基于邻域分类精度的不确定性评价函数,用以评价邻域粒子的不确定性,分辨关键性基因;进一步融合鱼群智能方法,设计一种基因选择算法,选取分类性强的少量关键基因;最后,在两个癌症基因数据集中进行基因选择,采用SVM分类器对获取的关键基因组进行分类实验。实验结果表明,采用该方法获取的基因组具有较低的冗余度及较好的分类性能。  相似文献   

5.
不确定性数据的频繁项集挖掘的算法—U-apriori算法采用逐层迭代搜索方法,使用候选项集来找频繁项集.分析了U-apriori算法的流程和实现过程,并通过实验对比得出U-apriori算法花费较少时间和空间的优点,最后针对该算法的缺点提出了改进思路.结果表明:U-apriori算法是最佳概率频繁模式挖掘方法之一.  相似文献   

6.
分类是机器学习领域最重要的一类问题,其中K近邻法和Logistic回归是两个重要的机器学习算法。本文主要研究了K近邻算法和Logistic回归模型在数据分类问题中的具体应用。针对K近邻算法,在考虑数据特征基础上,分别用欧氏距离和曼哈顿距离作为距离度量,同时,对于Logistic回归分类问题,提出了一种改进的随机梯度上升算法。通过选取了UCI机器学习数据集中的Horse Colic、Wine Quality两个数据集对算法进行验证,应用结果表明:K近邻算法中使用欧氏距离更适合Wine Quality,并且改进的随机梯度上升算法显著提高了Logistic学习机器的训练时间,说明了K近邻法和改进Logistic回归分类算法具有良好的分类效果。  相似文献   

7.
针对乳腺癌早期辅助检测与诊断问题,提出一种改进的基于电阻抗频谱特性的乳腺组织分类算法。根据人体电阻抗特征数据特点,利用主成分分析法降低数据维数和去除噪声,然后采用支持向量机对数据进行分类。由此结合主成分分析和支持向量机,得到改进的分类算法。实验结果表明,改进的分类算法可以有效地对乳腺组织进行分类,准确率达80%以上,特别对乳腺癌和脂肪组织的分类准确率超高95%。  相似文献   

8.
为提高不平衡数据集中少数类的分类性能,本研究提出一种改进的AdaBoost算法(UnAdaBoost算法)来解决数据不平衡问题。该方法首先改进基分类器,使其在损失一定程度的多数类分类性能的情况下提高少数类的分类性能,而多数类分类性能的损失可通过后面的多个分类器集成弥补回来,这样既提高了少数类的分类性能又不会损失多数类的分类精度。本研究把改进的朴素贝叶斯方法作为基分类器,用改进投票权值的AdaBoost算法对基分类器进行融合。实验结果表明,与传统的Adaboost算法相比,该方法可以有效地提高不平衡数据的分类性能。  相似文献   

9.
针对于MDSMOTE算法在生成部分新样本时没有将错分样本纳入其中的问题,将对错分样本修正的方法加入到现有的MDSMOTE算法中,提高样本的质量;对于传统FSVM在对不平衡数据集分类时,不能解决超平面偏向少数类的问题,将正负惩罚系数、模糊因子加入到FSVM中,提高不平衡数据的识别率。将改进的算法用于京东网购评语数据集分类中,该算法的分类性能较其他算法平均提升了9.13%,表明了该方法的可行性和有效性,具有实际应用价值。  相似文献   

10.
针对传统网页分类中存在的准确率和查全率不高、分类效率低的情况,提出一种基于朴素贝叶斯分类的网页预分类算法.算法根据用户的网上活动情况提取相关网址,分析网页内容和网页关键词,利用朴素贝叶斯分类算法进行分类,根据用户对各类网页的浏览情况分析用户的行为特征.采用改进的文本权值计算方法,并引进网址预分类机制,提高数据的处理效率以及分类的准确率.结果表明,网址分类算法准确,能够充分发掘用户的兴趣喜好,可以作为用户行为分析的数据算法进行商业推广和司法取证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号