本案例我们探究有机物在水中的溶解度,试图训练一个通用模型来预测任何有机物的水溶液溶解度。本案例分数据收集、模型训练、溶解度预测3个步骤。
1. 数据收集
我们从文献中搜集1000个有机物的水溶液溶解度数据,单位logS(mol/L)。整理成海森平台支持的csv文件格式,第1列为有机分子的smiles码,第2列为水溶解度,单位logS(mol/L)。
2. 模型训练
在海森大数据平台,训练有机物溶解度模型。
-打开“AI材料设计”界面;
-在“模型训练”页面中,打开“开始训练模型”;
-上次整理好的溶解度csv文件,填写模型名称,点击“开始训练”;
-等待训练结束后,可看到模型的评价参数
-如果测试集R² < 0.6,建议在预选模型中选择其他模型,直到R² > 0.6,这样有机物溶解度模型就训练好了。
3. 溶解度预测
-在“AI预测”-- “任务管理”页面中,打开“数据库检索预测”。
-在弹出窗口中绘制一个母核分子,填写任务名称、选择上一步训练好的溶解度模型,填写数量,点“子结构检索”。
-等待数据库中检索出子结构后,点“开始预测”。
-等待预测完成后,在任务列表中,点开“结果”,查看预测结果。
2024-04-23
海森大数据