基于LightGBM模型的中国成人吸烟行为研究 |
| |
作者姓名: | 刘忠华 卢鑫 梅文强 赵旻 胡彬彬 张轲 殷红慧 |
| |
作者单位: | 1. 中国烟草总公司云南省公司;2. 云南省烟草公司文山州公司;3. 云南省烟草农业科学研究院;4. 云南省烟草质量监督检测站 |
| |
摘 要: | 采用2018年世界卫生组织在中国开展的成人烟草调查数据,对成人吸烟行为影响因素进行探究。首先对原始数据做数据清洗,包括剔除无关变量、组合新变量等步骤。其次结合卡方检验、方差分析以及最大互信息数对处理后的数据集进行特征选择。再次基于XGBoost、LightGBM算法进行建模,对影响成人吸烟行为的因素进行排序和分析。最后基于表现较好的LightGBM模型进行变量组合建模,进一步挖掘吸烟者特征。经建模分析,识别得出成人性别、烟草环境、增税态度、低焦油烟认知、学历、年龄重要性由强至弱对吸烟行为产生影响。
|
关 键 词: | LightGBM XGBoost 吸烟行为 |
|
|