首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
决策树是数据挖掘技术中的重要方法,主要用于分类和预测。本文介绍决策树算法中应用最广泛的典型算法C4.5,对决策树的构建和剪枝进行介绍,阐明了C4.5算法的主要思想。  相似文献   

2.
传统的k-means算法对噪声和孤立点数据是敏感的,少量的该类数据将会影响聚类结果的精度。针对此算法存在的问题,本文提出一种改进的k-means算法,该算法使用基于加权的改进k-means方法确定类中心。实验证明,改进算法大幅度地降低了聚类结果对噪声和孤立点数据的敏感性,提高了聚类正确率。  相似文献   

3.
针对PCM算法在聚类计算过程中存在的初始聚类中心随机选取,聚类结果可能陷入局部最优解等问题,提出一种改进策略.利用SOM网络对数据进行初步处理,得到PCM算法的初始聚类中心,使得算法聚类效果得到明显提升.  相似文献   

4.
忠诚顾客是保证服装品牌企业持续向好运营的重要消费者之一。网络服装品牌的不断增加加之逐渐被大众认可的线上销售模式,对服装品牌门店的销售产生了一定的冲击。针对这一问题,本文从决策树C4.5算法角度,对影响门店的顾客忠诚度因素进行模型预测分析。经过所构建模型的测试,准确率达到86%。并通过模型可知,服装品牌门店影响顾客忠诚度的关键因素为感知产品因素。  相似文献   

5.
二维非接触人体测量中体型的模糊聚类分析   总被引:1,自引:0,他引:1       下载免费PDF全文
王玉秀  李晓久  刘皓 《纺织学报》2007,28(2):100-103
二维非接触人体测量系统中,围度尺寸需要通过二维至三维的数据转换间接获得。为增强围度预测的精度,应按不同体型类别分别建立预测模型。为避免指标间的信息重复,进行主成分分析,将原有的24项指标归纳为4项综合指标,对人体体型进行客观的综合评价。应用模糊C均值聚类分析进行人体体型分类,分别建立预测模型,以最大隶属度原则对样本进行分类。应用F统计量和聚类有效性函数检验聚类的有效性,并结合实际应用结果确定最佳分类数。  相似文献   

6.
针对密度峰聚类算法中局部密度定义和聚类分配策略的不足,提出了一种基于共享逆近邻与指数核的密度峰聚类算法。该算法利用样本的共享逆近邻点和指数核函数构造一种相似度,得到一种新的密度并将其应用在密度峰聚类算法中生成初始簇,然后将这些簇与凝聚层次聚类算法结合形成最终的类簇。数值实验证明:提出的基于共享逆近邻与指数核的密度峰聚类算法在真实数据集上的聚类结果要优于其他密度聚类算法,并能有效解决密度峰聚类算法中局部密度定义问题和聚类分配策略问题。  相似文献   

7.
针对服装企业O2O(Online to Offline,线上到线下或线下到线上)渠道背景下,货品管理中存在的需求预测问题进行探析。利用决策树算法和自动回归技术,分别建立按O2O销售渠道和实体店铺地域划分的货品需求预测模型。根据案例企业ERP系统中线上及线下的实际历史销售数据,由模型计算得到未来第1季度的预测值,并与线上及线下的实际销售值进行对比分析,验证模型的准确度。结合案例企业不同渠道实际配货补货需求及事例解析,得出需求预测模型可帮助企业对货品进行合理分配,减少库存成本及缺货风险。  相似文献   

8.
在数据挖掘中设备振动信号数据庞大,使用粗糙集中的属性规约算法可以过不相干属性,找出有用规则。决策树当中的C4.5算法继ID3算法新拓展了一些功能,它分类规则准确、速度快。把这两种方法结合起来数据挖掘技术在设备故障诊断中速度将会更快并且更准确。实验结果说明,把这两种方法结合起来更有效。  相似文献   

9.
基于决策树雪花牛肉大理石花纹分级模型   总被引:1,自引:0,他引:1  
为建立雪花牛肉大理石花纹等级评价方法,根据不同等级雪花牛肉大理石花纹图像特征及人工评级的标准,确定了影响大理石花纹的等级主要因素。本研究提出影响大理石花纹等级的几何参数特征、几何分布参数特征和统计参数特征。其中几何参数特征主要反映大理石花纹面积、周长等;几何分布特征主要反映大理石花纹图像中脂肪颗粒沉积的密度,根据脂肪颗粒沉积情况可分为大颗粒脂肪、中颗粒脂肪、小颗粒脂肪等;统计参数特征主要反映大理石花纹丰富程度以及大理石花纹分布均匀性。利用相关性分析提取影响雪花牛肉大理石花纹等级的特征参数。建立基于C4.5和CART算法的决策树模型,结果表明:对于C4.5算法建立的决策树分级模型,三级和五级大理石花纹分级预测精度分别为91.80%、92.31%,而该模型针对四级样本建立的模型无效,其结果多数误判为三级;对于CART算法建立的决策树模型同样存在这样的问题,即三级和五级大理石花纹分级预测精度高,而对四级样本分级无效。  相似文献   

10.
提出一种基于词嵌入与密度峰值策略的文本聚类算法,并将其应用于大数据网络文本数据中。通过对文本数据进行预处理转化为词嵌入表示的实数向量,并进一步采用密度峰值聚类算法实现文本聚类。实验表明该方法在准确率、召回率以及F值等指标上均优于传统文本聚类算法。  相似文献   

11.
  目的  为进一步提高卷烟月度销量预测精度,  方法  本文选择ARIMA模型、基于梯度下降算法的BP神经网络模型、基于Levenberg-Marquardt算法改进的BP神经网络模型等3种模型为单项预测模型, 并利用BP神经网络对各单项预测模型进行动态加权, 构建非线性组合模型对全国卷烟月度数据进行预测。首先, 利用各单项预测方法对卷烟历史数据进行仿真拟合, 并对2018年1~4月的销量进行预测; 其次, 构建非线性组合预测模型, 对3个单项预测模型的拟合及预测结果进行动态加权, 充分利用各个模型的优势, 获取销量数据的各方面的信息。  结果  研究表明, 相比于单项预测模型, 组合预测模型误差绝对值均小于当月的日均销售量, 预测误差更加均衡, 结果更加平稳, 适应性更强, 更符合卷烟销售的实际情况。   相似文献   

12.
华勇 《中国烟草学报》2015,21(4):99-106
为准确预测卷烟月度投放量,采用时间序列模型中的季节变动预测法,根据实际情况改进算法,设定了“下月日均销量”和“目标月存销比”这两个定量调控预测手段,通过存销比管理,建立了卷烟月度投放量预测模型。实证检验表明该模型能够进行较为准确的月度预测,可以据此在工商协同营销系统中创新、优化工商月度网上配货工作。   相似文献   

13.
在分析服装销售预测影响因素的基础上,综述服装销售预测模型的研究进展,并结合模型特征对比不同预测方法的优缺点,同时指出服装销售预测研究趋势与方向。将服装销售预测影响因素归纳为4点,包括周期性因素、季节性因素、分类方案及其他解释变量,提出产品特征与预测方法的关联方案,阐释影响服装销售的解释变量。从统计预测方法、人工智能预测方法及混合模型角度,分类阐述不同预测方法的工作原理及预测效果,重点介绍混合模型的最新应用及预测优势。基于服装销售预测研究趋势,根据研究进展与现存问题,提出服装销售预测研究的发展方向。  相似文献   

14.
池可  陈雁 《纺织学报》2009,30(10):139-142
服装销售预测的准确性除了取决于对服装销售影响因素的了解外,很大程度上还取决于选择适当的预测方法,快速而且准确的选择一个适合于企业实际情况的预测方法是建立综合预测模型的基础。通过对销售预测对象信息的分析,在对其分类的基础上对几种基本预测方法进行样本预测,结合预测结果与预测方法原理的分析对这些基本方法的适用范围进行评价,提出适用于服装销售预测的方法选择表,使预测方法与预测对象信息互相匹配,提高预测的效率和效果,为企业便捷的选择预测方法提供新的思路。  相似文献   

15.
目的 食品不合格指标危害人类饮食健康,本文将数据挖掘技术应用于食品安全检测中。方法 通过收集山东省食药局官方网站下发的2015~2019年食品安全抽样检验产生的不合格数据,并对其进行多项数据预处理操作,采用超参数网格搜索和10折交叉验证方法建立了基于随机森林的食品不合格指标的分类预测模型,另外,通过对传统随机森林模型的参数优化,将其与决策树(DT)、逻辑回归(LR)和梯度提升决策树(GBDT)算法分类预测结果进行了对比。结果 实验表明经过参数优化后的随机森林模型对食品中不合格指标的预测准确率能够达到89.4%,比DT算法提高了11%,比LR算法提高了9%,比GBDT算法提高了8.1%。结论 基于优化的随机森林模型可以完成食品不合格指标分类预测任务,有广阔的应用前景。  相似文献   

16.
目的 基于机器学习算法,对同样重量范围下的牡蛎按照肥满度高低进行分类。方法 首先利用数字图像处理技术提取牡蛎外部形态特征, 获得牡蛎的粗糙度,伸长率,紧密度,长轴,短轴,面积等特征指标作为参数。然后利用机器学习算法在数据分析上的强大功能,采用随机森林(random forest, RF)算法与梯度提升决策树 (Gradient Boosting Decision Tree, GBDT) 算法分别构建肥满度识别模型。最后,将模型用于不同重量范围的牡蛎样本,对牡蛎进行肥满度识别分类。结果 对于0~50g的牡蛎, RF算法能取得较好的效果,肥满度识别率达到79.3%,50~100g的牡蛎,GBDT算法的肥满度识别率达到86.4%。结论 相对于传统的按照重量对其肥满度分类而言,本方法能够快速有效的识别出相同重量范围下牡蛎肥满度的高低, 为牡蛎分类提供了新的方法。  相似文献   

17.
为实现大米品种的准确鉴别,提出一种基于太赫兹时域光谱(Terahertz Time-Domain Spectroscopy, THz-TDS)技术的大米品种识别方法。利用标准差(Standard Deviation, SD)和区间偏最小二乘(Interval Partial Least Square, iPLS)选取0.53~1.21 THz波段的吸收光谱信息作为分类模型的输入数据,再采用决策树模型(Decision Tree, DT)对四种大米吸收光谱进行分类识别,并在模型训练过程中结合网格搜索算法寻找模型最优参数。为增加实验对比度,分别使用逻辑回归模型和支持向量机模型进行对比实验,其模型分类准确率分别为80.75%和88.75%。实验结果表明,太赫兹时域光谱技术结合SD、iPLS和DT方法可以实现大米品种的准确识别,准确率可达95%,为农产品品种识别提供了一种新的鉴别方法。  相似文献   

18.
目的 利用太赫兹衰减全反射(terahertz attenuated total reflection,THz-ATR)光谱法实现花生冻伤的快速鉴别。方法 实验选择种子公司购入的同品种冻伤和非冻伤花生各500粒,采集1000粒花生样本的0~359.97 cm-1 THz光谱,通过光学参数计算得到样本集的吸光度、折射率和吸收系数。采用3点移动窗口平滑预处理和随机森林算法建立基于不同光学常数的花生冻伤识别模型。结果 在决策树棵数为500,特征变量数为38时,基于太赫兹吸光度建立的花生冻伤判别模型性能最佳,准确率、召回率、精确率达到97.0%、98.0%、96.1%。结论 本研究所建立的定性模型准确率高, THz-ATR技术有望为花生冻伤的快速无损鉴别提供一种新的高效的检测方法,为太赫兹技术在食品检测领域的应用提供了现实依据。  相似文献   

19.
以服装采购决策为研究对象,运用二级模糊综合评判方法对服装采购进行决策判别并予以评判。从消费者的角度出发,通过调查问卷的方法确定影响服装销售量的因素,并根据实际情况进行调整,最终构成评判指标体系;通过专家估测法确定评价体系中各因素的权重分配;用专家评价、采购员打分以及建立隶属函数的方法确定评价矩阵;采用最大隶属度原则确定服装上市后的销售量情况,并根据评判结果对服装是否采购以及采购量如何进行分析,为订单决策提供了理论参考依据。  相似文献   

20.
针对目前电力营销管理系统缺少有效的营销数据决策支持的问题,将基于信息熵的决策树挖掘算法应用于电力营销中,并建立电力客户分类模型.实际应用结果表明,该分类模型具有较好的预测分类能力,能够满足电力营销工作中的客户及时准确分类的需要.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号