项目概述:该项目主要职责是根据房子的一些属性来预测其房价,先对数据进行前期处理,提取有效特征,之后分别利用岭回归、随机森林和 XGBoost
对房价进行了预测;
项目职责:
1.利用 pandas 读取数据,检视源数据,将测试和训练数据进行合并,减少数据前期处理步骤;
2.数据前期处理:对房屋价格采用对数方法进行平滑处理、对属性特征进行 one-hot 编码和利用平均值来处理缺失值;
3.将数据分成训练和测试集,采用交叉验证方法,分别利用岭回归、随机森林和 XGBoost 来建立模型;
4.取均方误差作为损失函数,利用网格搜索,调整超参数,选出最好的 alpha 值;
5.根据测试数据表现,选择最优模型,最后发现 XGBoost 对房价预测效果最好
点击空白处退出提示
评论