个人介绍
5年大数据开发经验,擅长实时数据处理与数据平台建设,能独立承接从需求沟通、方案设计、开发到上线运维的全链路交付。
核心技术:Flink 2.0 / Flink CDC / Kafka 实时数据链路,Spark SQL / Hive 离线计算,TiDB / Doris / MongoDB / HANA 等多种存储,ODS-DWD-DWS-ADS 完整数仓分层建模,Checkpoint 调优、反压分析等生产级性能优化经验。
我还擅长把 AI 能力融入数据链路:用 GPT-4o / Qwen 大模型 API、PaddleOCR 做多语言数据清洗、PDF/PNG 非结构化文档抽取,多模态场景下抽取准确率可达 90% 以上。
可承接的项目类型:实时/离线数据管道开发、数据仓库搭建、ETL/数据治理、BI 报表与数据看板、数据质量体系建设、AI 辅助的数据清洗与信息抽取、企业数据对接与同步等。
过往独立交付过海外企业数据实时基座、集团财务合并报表平台、ERP 数据治理等项目,支撑过百万级数据规模,数据完整性做到 99.9%。注重沟通效率和交付质量,方案讲清楚、进度透明、按时上线。欢迎沟通需求,一起把事情做扎实。
工作经历
2025-12-25 -2026-05-31企查查大数据工程师
主要负责海外项目的数据开发工作以及ai结合数据开发工作,包含但不限于订单数据流程搭建,数据清洗等
教育经历
2017-09-01 - 2021-06-30哈尔滨信息工程学院软件工程本科
资质认证
语言
中文母语水平
0
1
2
3
4
5



