AI+药物预测相关工作;
前期准备工作:阅读大量 hERG 毒性预测相关文献,收集整理文献中使用的数据集来源;
数据处理:使用一些常用的库,将小分子结构转换为计算机可识别的数据; 通过缺失值和无效值处理等操作清洗数据;
模型构建及应用:分析并复现文献中的模型,同时自己设计并训练多个机器学习模型 (随机森林, XGBoost, 投票模型以及深度神经网络)用于数万小分子的 hERG 毒性分类检测; 使用准确率, F1-score, AUC-ROC 曲线等横向对比模型表现; 结合可解释方法,分析小分子的特征性质对药物预测的贡献情况