首页 | 本学科首页   官方微博 | 高级检索  
     

基于决策树的消费行为分析
引用本文:龚斌,李国和,吴卫江,洪云峰.基于决策树的消费行为分析[J].信息技术,2016(4):14-17.
作者姓名:龚斌  李国和  吴卫江  洪云峰
作者单位:中国石油大学(北京)地球物理与信息工程学院;中国石油大学(北京)油气数据挖掘北京市重点实验室;石大兆信数字身份管理与物联网技术研究院
基金项目:国家自然科学基金(60473125);国家高技术研究发展计划(863)(863-317-01-04-99,2009AA062820);中国石油(CNPC)石油科技中青年创新基金(05E7013);国家重大专项子课题(G5800-08-ZS-WX)
摘    要:消费行为因素分析对产品生产和销售具有重要指导作用。C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法,先对消费数据集进行数据预处理,为了利用消费者的消费数据进行消费行为分析,对消费数据形式化表示,形成消费客户交易数据集和交易统计信息表达。然后在消费客户交易数据集上定义了信息增益率,反映消费因素的分类能力。利用C4.5算法对消费者行为进行分析并构造出决策树,挖掘消费数据之间隐藏的潜在关系,对企业的生产经营具有重大的指导意义;运用预剪枝和后剪枝对完全决策树进行剪枝,对比剪枝后效果。

关 键 词:决策树  C4.5算法  信息增益率  连续型属性

Analysis of consumer behavior based on decision tree
GONG Bin;LI Guo-he;WU Wei-jiang;HONG Yun-feng.Analysis of consumer behavior based on decision tree[J].Information Technology,2016(4):14-17.
Authors:GONG Bin;LI Guo-he;WU Wei-jiang;HONG Yun-feng
Affiliation:GONG Bin;LI Guo-he;WU Wei-jiang;HONG Yun-feng;School of Geophysics and Information Engineering,China University of Petroleum;Beijing Key Lab of Data Mining for Petroleum Data,China University of Petroleum;Pan Pass Institute of Digital Identification Management and Internet of Things;PanPass Institute of Digital Identification Management and Internet of Things;
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号