描述:基于上千行,列维度为 303 的数据集进行数据处理、模型训练和预测测试
集 SalePrice 变量的值;
• 职责:数据的基本处理(Matplotlib 可视化、缺失值处理等)、平滑化,特征工程
以及算法尝试、参数调试和模型的训练等
• 技术:
1. pandas 和 numpy 做数据处理,log1p()平滑化,(X-X’)/s 标准化;
2.调用 RF,Ridge,xgboost 模型等,训练调参,优化模型。
• 项目地址:
https://www.kaggle.com/joshuasea/titanic?scriptVersionId=11739826
点击空白处退出提示












评论