DF的一个多模态文本分类比赛https://www.datafountain.cn/competitions/423/teams?view=all
最终成绩 Top0.5%
A榜34/2049,B榜10/2049
比赛过程:
1.EDA分析训练数据 -> 数据重采样 -> 微调bert,添加FGM扰动,多任务学习->半监督学习,数据扩增->指标优化->分析bad case,对训练数据进行数据清洗,特征选择->利用stacking和voting进行模型融合,提分4个百分点。
点击空白处退出提示
评论