描述:基于上千行,列维度为 303 的数据集进行数据处理、模型训练和预测测试集 SalePrice 变量的值;• 职责:数据的基本处理(Matplotlib 可视化、缺失值处理等)、平滑化,特征工程以及算法尝试、参数调试和模型的训练等• 技术:1. pandas 和 numpy 做数据处理,log1p()平滑化,(X-X’)/s 标准化;2.调用 RF,Ridge,xgboost 模型等,训练调参,优化模型。• 项目地址:https://www.kaggle.com/joshuasea/titanic?scriptVersionId=11739826
评论