首页 | 本学科首页   官方微博 | 高级检索  
     

基于LightGBM模型的中国成人吸烟行为研究
作者姓名:刘忠华  卢鑫  梅文强  赵旻  胡彬彬  张轲  殷红慧
作者单位:1. 中国烟草总公司云南省公司;2. 云南省烟草公司文山州公司;3. 云南省烟草农业科学研究院;4. 云南省烟草质量监督检测站
摘    要:采用2018年世界卫生组织在中国开展的成人烟草调查数据,对成人吸烟行为影响因素进行探究。首先对原始数据做数据清洗,包括剔除无关变量、组合新变量等步骤。其次结合卡方检验、方差分析以及最大互信息数对处理后的数据集进行特征选择。再次基于XGBoost、LightGBM算法进行建模,对影响成人吸烟行为的因素进行排序和分析。最后基于表现较好的LightGBM模型进行变量组合建模,进一步挖掘吸烟者特征。经建模分析,识别得出成人性别、烟草环境、增税态度、低焦油烟认知、学历、年龄重要性由强至弱对吸烟行为产生影响。

关 键 词:LightGBM  XGBoost  吸烟行为
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号