个人介绍
我是程序员客栈的tuzi06,一名数据开发者;
我毕业于西蒙弗雷泽大学,担任过麦克马斯特大学附属 HHS 人口健康研究所的数据分析师;
负责过多源研究数据分析项目,自动化数据管理系统开发项目,研究项目支持平台开发等项目的开发;
熟练使用Python(Pandas/PySpark),Java/JavaScript,MongoDB/MySQL/Oracle,React/Node.js;
如果我能帮上您的忙,请点击 “立即预约” 或 “发布需求”!
工作经历
2024-05-13 -2025-06-02麦克马斯特大学附属HHS人口健康研究所解决方案工程师
(一) 多源研究数据分析 运用 Python (Pandas、PySpark、SciPy 等), 对超 500GB 多源生物医学数据进行去噪、缺失值处理与格式标准化,缺失值填充准确率达 96%,确保数据的准确性、完整性与分析可用性。 使用临床统计、疾病预测 (ML)、影像分析 (AI) 模型提取数据特征,识别与研究目标的关联特征 30 + 项,ML 模型特征提取准确率稳定在 85% 以上。 构建从数据清洗到特征提取与分析的自动化工作流 (Snakemake),实现各环节数据处理、流转的标准化与自动化,将单批次数据处理周期从 3 天缩短至 1.2 天,效率提升 60%。 通过 Matplotlib、Seaborn 等工具累计生成 20 + 份标准化可视化报告,协助科学家研究团队完成 10 余次模型验证与优化,加速科研创新迭代。 (二) 自动化数据管理系统 使用 Python (Pandas 库) 和 JavaScript 设计并实现模块化数据管道,自动化完成日均 1000 + 条数据的验证、转换与筛选流程,数据处理通过率提升至 98%。 根据日常使用规律及分析师反馈,迭代优化管道逻辑
教育经历
2018-09-01 - 2022-05-01西蒙弗雷泽大学计算机科学与技术本科





