kaggle比赛项目通过xgb预测乘客是否生还,通过python对数据进行清洗处理,切分字符串、去重、填充缺失值等技术。然后进行特征工作操作,onehot编码、标签编码、分箱、多重共线性检测等技术。使用xgb,随机森林、gbdt等算法进行建模,网格搜索的方式找到最优模型,对测试集进行预测
评论