以离子液体密度为例的分子性质预测模型建模方法探讨 |
| |
作者姓名: | 陈家辉 杨鑫泽 陈顾中 宋震 漆志文 |
| |
作者单位: | 华东理工大学化工学院,化学工程联合国家重点实验室,上海 200237 |
| |
摘 要: | 分子性质预测模型是针对特定应用需求筛选设计化学品的有力工具,然而诸多相关建模过程中的测试集划分、交叉验证、算法选择等关键环节普遍存在严谨性不足的问题,模型真实预测性能难以保证。以基团贡献法预测离子液体密度为例,探讨了分子性质预测模型建模过程中数据集划分和交叉验证的重要性,提出了自动基团划分方法并研究了数据集中基团涉及分子个数对预测精度的影响。通过对比五种回归算法(多重线性回归、岭回归、随机森林、支持向量机、神经网络),基于岭回归的基团贡献模型预测性能最佳,在由1078种离子液体、共计23034个数据点组成的数据集上得到的平均相对误差为1.88%。
|
关 键 词: | 分子性质预测 模型 数据集划分 交叉验证 算法 离子液体 密度 |
收稿时间: | 2022-07-27 |
|
| 点击此处可从《化工学报》浏览原始摘要信息 |
|
点击此处可从《化工学报》下载全文 |
|