有机物水溶液溶解度模型训练和预测

本案例我们探究有机物在水中的溶解度,试图训练一个通用模型来预测任何有机物的水溶液溶解度。本案例分数据收集、模型训练、溶解度预测3个步骤。

1. 数据收集

我们从文献中搜集1000个有机物的水溶液溶解度数据,单位logS(mol/L)。整理成海森平台支持的csv文件格式,第1列为有机分子的smiles码,第2列为水溶解度,单位logS(mol/L)。

2. 模型训练

在海森大数据平台,训练有机物溶解度模型。

-打开“AI材料设计”界面;

-在“模型训练”页面中,打开“开始训练模型”;

-上次整理好的溶解度csv文件,填写模型名称,点击“开始训练”;

-等待训练结束后,可看到模型的评价参数

-如果测试集R² < 0.6,建议在预选模型中选择其他模型,直到R² >  0.6,这样有机物溶解度模型就训练好了。

3. 溶解度预测

-在“AI预测”-- “任务管理”页面中,打开“数据库检索预测”。

-在弹出窗口中绘制一个母核分子,填写任务名称、选择上一步训练好的溶解度模型,填写数量,点“子结构检索”。

-等待数据库中检索出子结构后,点“开始预测”。

-等待预测完成后,在任务列表中,点开“结果”,查看预测结果。