共查询到20条相似文献,搜索用时 218 毫秒
1.
2.
传统的k-means算法对噪声和孤立点数据是敏感的,少量的该类数据将会影响聚类结果的精度。针对此算法存在的问题,本文提出一种改进的k-means算法,该算法使用基于加权的改进k-means方法确定类中心。实验证明,改进算法大幅度地降低了聚类结果对噪声和孤立点数据的敏感性,提高了聚类正确率。 相似文献
3.
针对PCM算法在聚类计算过程中存在的初始聚类中心随机选取,聚类结果可能陷入局部最优解等问题,提出一种改进策略.利用SOM网络对数据进行初步处理,得到PCM算法的初始聚类中心,使得算法聚类效果得到明显提升. 相似文献
4.
5.
6.
《纺织高校基础科学学报》2020,(2)
针对密度峰聚类算法中局部密度定义和聚类分配策略的不足,提出了一种基于共享逆近邻与指数核的密度峰聚类算法。该算法利用样本的共享逆近邻点和指数核函数构造一种相似度,得到一种新的密度并将其应用在密度峰聚类算法中生成初始簇,然后将这些簇与凝聚层次聚类算法结合形成最终的类簇。数值实验证明:提出的基于共享逆近邻与指数核的密度峰聚类算法在真实数据集上的聚类结果要优于其他密度聚类算法,并能有效解决密度峰聚类算法中局部密度定义问题和聚类分配策略问题。 相似文献
7.
8.
9.
基于决策树雪花牛肉大理石花纹分级模型 总被引:1,自引:0,他引:1
为建立雪花牛肉大理石花纹等级评价方法,根据不同等级雪花牛肉大理石花纹图像特征及人工评级的标准,确定了影响大理石花纹的等级主要因素。本研究提出影响大理石花纹等级的几何参数特征、几何分布参数特征和统计参数特征。其中几何参数特征主要反映大理石花纹面积、周长等;几何分布特征主要反映大理石花纹图像中脂肪颗粒沉积的密度,根据脂肪颗粒沉积情况可分为大颗粒脂肪、中颗粒脂肪、小颗粒脂肪等;统计参数特征主要反映大理石花纹丰富程度以及大理石花纹分布均匀性。利用相关性分析提取影响雪花牛肉大理石花纹等级的特征参数。建立基于C4.5和CART算法的决策树模型,结果表明:对于C4.5算法建立的决策树分级模型,三级和五级大理石花纹分级预测精度分别为91.80%、92.31%,而该模型针对四级样本建立的模型无效,其结果多数误判为三级;对于CART算法建立的决策树模型同样存在这样的问题,即三级和五级大理石花纹分级预测精度高,而对四级样本分级无效。 相似文献
10.
11.
12.
为准确预测卷烟月度投放量,采用时间序列模型中的季节变动预测法,根据实际情况改进算法,设定了“下月日均销量”和“目标月存销比”这两个定量调控预测手段,通过存销比管理,建立了卷烟月度投放量预测模型。实证检验表明该模型能够进行较为准确的月度预测,可以据此在工商协同营销系统中创新、优化工商月度网上配货工作。 相似文献
13.
在分析服装销售预测影响因素的基础上,综述服装销售预测模型的研究进展,并结合模型特征对比不同预测方法的优缺点,同时指出服装销售预测研究趋势与方向。将服装销售预测影响因素归纳为4点,包括周期性因素、季节性因素、分类方案及其他解释变量,提出产品特征与预测方法的关联方案,阐释影响服装销售的解释变量。从统计预测方法、人工智能预测方法及混合模型角度,分类阐述不同预测方法的工作原理及预测效果,重点介绍混合模型的最新应用及预测优势。基于服装销售预测研究趋势,根据研究进展与现存问题,提出服装销售预测研究的发展方向。 相似文献
14.
服装销售预测的准确性除了取决于对服装销售影响因素的了解外,很大程度上还取决于选择适当的预测方法,快速而且准确的选择一个适合于企业实际情况的预测方法是建立综合预测模型的基础。通过对销售预测对象信息的分析,在对其分类的基础上对几种基本预测方法进行样本预测,结合预测结果与预测方法原理的分析对这些基本方法的适用范围进行评价,提出适用于服装销售预测的方法选择表,使预测方法与预测对象信息互相匹配,提高预测的效率和效果,为企业便捷的选择预测方法提供新的思路。 相似文献
15.
目的 食品不合格指标危害人类饮食健康,本文将数据挖掘技术应用于食品安全检测中。方法 通过收集山东省食药局官方网站下发的2015~2019年食品安全抽样检验产生的不合格数据,并对其进行多项数据预处理操作,采用超参数网格搜索和10折交叉验证方法建立了基于随机森林的食品不合格指标的分类预测模型,另外,通过对传统随机森林模型的参数优化,将其与决策树(DT)、逻辑回归(LR)和梯度提升决策树(GBDT)算法分类预测结果进行了对比。结果 实验表明经过参数优化后的随机森林模型对食品中不合格指标的预测准确率能够达到89.4%,比DT算法提高了11%,比LR算法提高了9%,比GBDT算法提高了8.1%。结论 基于优化的随机森林模型可以完成食品不合格指标分类预测任务,有广阔的应用前景。 相似文献
16.
目的 基于机器学习算法,对同样重量范围下的牡蛎按照肥满度高低进行分类。方法 首先利用数字图像处理技术提取牡蛎外部形态特征, 获得牡蛎的粗糙度,伸长率,紧密度,长轴,短轴,面积等特征指标作为参数。然后利用机器学习算法在数据分析上的强大功能,采用随机森林(random forest, RF)算法与梯度提升决策树 (Gradient Boosting Decision Tree, GBDT) 算法分别构建肥满度识别模型。最后,将模型用于不同重量范围的牡蛎样本,对牡蛎进行肥满度识别分类。结果 对于0~50g的牡蛎, RF算法能取得较好的效果,肥满度识别率达到79.3%,50~100g的牡蛎,GBDT算法的肥满度识别率达到86.4%。结论 相对于传统的按照重量对其肥满度分类而言,本方法能够快速有效的识别出相同重量范围下牡蛎肥满度的高低, 为牡蛎分类提供了新的方法。 相似文献
17.
为实现大米品种的准确鉴别,提出一种基于太赫兹时域光谱(Terahertz Time-Domain Spectroscopy, THz-TDS)技术的大米品种识别方法。利用标准差(Standard Deviation, SD)和区间偏最小二乘(Interval Partial Least Square, iPLS)选取0.53~1.21 THz波段的吸收光谱信息作为分类模型的输入数据,再采用决策树模型(Decision Tree, DT)对四种大米吸收光谱进行分类识别,并在模型训练过程中结合网格搜索算法寻找模型最优参数。为增加实验对比度,分别使用逻辑回归模型和支持向量机模型进行对比实验,其模型分类准确率分别为80.75%和88.75%。实验结果表明,太赫兹时域光谱技术结合SD、iPLS和DT方法可以实现大米品种的准确识别,准确率可达95%,为农产品品种识别提供了一种新的鉴别方法。 相似文献
18.
目的 利用太赫兹衰减全反射(terahertz attenuated total reflection,THz-ATR)光谱法实现花生冻伤的快速鉴别。方法 实验选择种子公司购入的同品种冻伤和非冻伤花生各500粒,采集1000粒花生样本的0~359.97 cm-1 THz光谱,通过光学参数计算得到样本集的吸光度、折射率和吸收系数。采用3点移动窗口平滑预处理和随机森林算法建立基于不同光学常数的花生冻伤识别模型。结果 在决策树棵数为500,特征变量数为38时,基于太赫兹吸光度建立的花生冻伤判别模型性能最佳,准确率、召回率、精确率达到97.0%、98.0%、96.1%。结论 本研究所建立的定性模型准确率高, THz-ATR技术有望为花生冻伤的快速无损鉴别提供一种新的高效的检测方法,为太赫兹技术在食品检测领域的应用提供了现实依据。 相似文献
19.
20.
针对目前电力营销管理系统缺少有效的营销数据决策支持的问题,将基于信息熵的决策树挖掘算法应用于电力营销中,并建立电力客户分类模型.实际应用结果表明,该分类模型具有较好的预测分类能力,能够满足电力营销工作中的客户及时准确分类的需要. 相似文献