0
1
2
3
4
5
2025-09-01 -至今上海沸橙信息科技数据清洗工程师
项目概述: 该项目基于公司自研大模型基础上为公司训练大模型提供数据支持,训练数据来源较多如爬虫采取或mongodb数据库等,数据格式多有不同,需要对数据按照需求进行清洗,有助于提升模型训练效果,又如训练模型时数据过滤策略设置过于严格,导致模型回答存在缺失,需要对原始数据以及过滤后的数据进行二次拟合用来提高模型回答质量等。 个人职责: 参与需求分析、确认数据源以及清洗策略; 参与数据清洗方案讨论,确定数据和字段; 根据业务需求编写对应的清洗sql或pythonudf; 根据需求对清洗后的数据进行校验; 自测与交叉测试和 SQL 的优化,协助相关人员确定数据的逻辑的正确性
2025-09-01 - 2026-02-28临沂大学计算机科学与技术本科

