擅长处理数仓平台离线和实时数据。有ai大模型应用开发经验。熟练使用spark,sparksql, pysaprk,flink,flinksql, hive, seatunnel, hadoop, doris,powerbi, python, java, scala,dolphinscheduler, dify, n8n, spring,读过源码。有使用cursor, 通义的开发经验. 擅长通过数据建模与指标体系设计驱动决策。深度参与核心业务的数据体系建设,主导 ODS/DWD/DWS/ADS 分层模型设计,统一企业级指标口径。熟练对接可视化工具,推动“数据-报表-行动”闭环
通过数据建模与指标体系设计驱动决策。建设核心业务的数据体系,主导 ODS/DWD/DWS/ADS 分层模型设计,统一企业级指标口径。熟练对接可视化工具,推动“数据-报表-行动”闭环
1.为国内电商与线下支付数据构建了分层数据仓库,整合多源异构数据(数据来源有爬虫放入的kafka,mysql, ftp发过来的文件),显著提升了数据产出的时效性与准确性,稳定支撑了业务需求
2.技术栈: spark,flink, hive, seatunnel,doris, hadoop, dify,n8n,dolphinscheduler
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论