个人介绍
我是谢苏林,核心能力如下:
- **大数据全链路**:CDC数据同步 → 分布式存储计算(Hadoop/Flink/Doris/ClickHouse) → 数仓维度建模 → DataHub数据治理 → 资产标签化,具备从底层基础设施到数据价值变现的完整实战经验
- **AI与Agent智能化**:机器学习建模(推荐/预测) → 大模型应用 → Agent架构平台(Hermes多租户),具备模型训练、调优、推理到上线全流程闭环能力
- **大模型工程**:Qwen/DeepSeek基座选型 + 微调 + RAG + Skill MCP,具备从基座选型到应用落地的完整能力
工作经历
2018-06-26 -至今金蝶公司算法架构师
- 主导小微数仓从0到1建设,覆盖百万级客户、日均处理数据亿条,基于Flink CDC+Hadoop/Doris构建分布式数仓底座,通过DataHub实现数据治理与资产标签化,赋能经营决策与精准获客 - 落地大模型应用(Qwen/DeepSeek基座,微调+RAG+Skill MCP):自定义报表(NL2SQL,文本+语音→SQL)、智能生单(多模态→进销存单据,准确率90%+)、发票流水转凭证(多模态→财务凭证,准确率80%+),均已产品化输出至多条产品线 - 供应链智能化:打通工厂制造→运输→仓储→零售终端全链路协同,销量预测(准确率80%,节省成本约30%),智能选仓优化仓储选址与库存周转率,智能数据协同减少生产端与批发端的牛鞭效应,降低供应链各环节风险,已上线与客户联合验证 - 智能推荐系统:上线后小微企业服务提单与投诉显著下降 - 基于Hermes框架搭建多租户Agent平台,提供统一会话/记忆体/上下文管理,支持ReAct等规划策略,业务可快速搭建Agent并交互验证,已服务智能生单、发票与流水转凭证等AI原生场景 - 解决Agent企业落地核心痛点:可靠性采用混合架构(关
2015-06-15 -2018-06-22深圳市至尊量化投资管理有限公司策略分析师
- 构建机器学习策略平台,完成多因子选股、期权复制、Alpha对冲、跨品种套利等多套量化策略,均已用于产品或进入策略库 - 搭建策略评估系统,从收益、回撤、稳定性、风险归因等多维度统一评估标准,被公司推广为策略评审规范 - 构建基本面因子池与交易性因子池,基于SVM/随机森林/XGBoost等模型进行因子有效性评估与策略建模
2011-12-12 -2015-06-05宜搜科技高级技术经理
- 主导数据处理底座从Oracle向Hadoop迁移,搭建Hive分析平台与HBase分布式内容存储平台,支撑全公司数据业务 - 基于维度建模构建数仓,覆盖访问/搜索/下载日志、内容/订购/用户等核心数据,满足产品运营与各产品线数据需求 - 搭建数据分析可视化平台,推动运营与产品从经验决策转向数据驱动 - 构建内容推荐系统,上线后用户转化率提升约**25%** - 组建8人Hadoop技术团队,培养2名技术骨干和1名数据分析业务骨干
2010-03-01 -2011-12-09华为技术系统分析师
- 基于Hadoop开源生态搭建华为大数据处理底座,深入分析HDFS/MR/ZK源码,验证企业级场景下的技术痛点 - 针对早期Hadoop无热备、无法满足7×24小时可靠性等痛点,负责提出**HDFS HA方案**(同事负责JobTracker HA),并设计**HBase二级索引方案**
教育经历
2001-09-01 - 2005-06-07中南大学应用数学本科





