个人介绍
我是程序员客栈的【流码李哥】,一名【算法与高性能优化工程师】; 我毕业于【复旦大学MSE】,担任过【紫光华智】的【算法工程师】,担任过【中科曙光】的【异构优化工程师】; 负责过【智能安防算法优化】,【大模型算子优化库】,【大模型通信优化】的开发; 熟练使用【pytorch】,【C++】,【cuda】,【git】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2022-08-01 -至今中科曙光信息产业异构计算工程师
中科曙光是国内领先的信息基础设施与智能计算解决方案提供商,核心业务聚焦 “算力基础设施构建 + AI 全栈生态赋能”,具体包括: 智算硬件研发:推出 scaleX640 超节点等高性能智算集群,通过算、存、网、电、冷一体化紧耦合设计,支撑 MoE 万亿参数大模型训练与推理场景。 软件平台打造:发布 OneScience 科学大模型一站式开发平台,集成多领域热点模型与工具链,赋能 AI for Science(科学智能)等前沿场景。 生态协同建设:主导 “AI 计算开放架构”,联合产业链企业构建软硬协同的国产智算生态,支持多品牌加速卡与主流计算生态兼容。 行业解决方案:为科研机构、政企客户提供从算力部署到模型开发的全流程服务,覆盖气象、生物、金融等多个领域的智能化转型需求。 我主要负责,大模型相关算子优化、算子融合、通信库性能优化,训练与推理的框架对接等 1、大模型相关算子优化 针对大模型核心算子(如flashattention、矩阵乘、激活函数等),结合公司智算硬件特性(如超高速总线、高密度计算单元)进行底层优化。 适配 FP8 等混合精度计算方案,在保障模型精度的前提下,提升算子计
2021-02-01 -2022-06-30新华智云科技有限公司算法工程师
媒体领域:“媒体大脑” 平台是全国首个 AI 媒体平台。平台推出了 MAGIC 短视频智能生产平台,集成了众多媒体机器人,如突发识别机器人、人脸追踪机器人、智能配音机器人、视频包装机器人等,可帮助新闻工作者更高效地采集、处理和发布新闻资源。 文旅领域:“文化数字化操作系统”是全国首个 AI 文旅融合平台,通过整合文化和旅游资源,运用人工智能技术实现文化资源的数字化展示、传播和旅游服务的智能化升级。 其他还有金融领域、MCN领域等 我的工作是为为媒体机器人和文旅AI互动提供算法支持,包括深度估计、图像清晰度增强、语音识别、语音生成等
2019-02-01 -2020-11-01重庆紫光华智科技有限公司算法工程师
公司聚焦于智算服务器、数图融合存储、智能终端和智慧大屏等核心基础设施的研发与生产。同时,全面推出算法产品、前端产品、视图存储、微云服务器、显示与控制、边缘计算、融合产品、软件应用产品系列。 我主要参与其中核心AI算法产品研发,边缘计算的产品对接工作
教育经历
2021-09-01 - 2025-06-30复旦大学软件工程硕士
2013-09-01 - 2017-06-30华北电力大学(北京))电气工程及其本科
语言

核心业务目标算子支持:实现FlashAttention、Grouped-QueryAttention等融合算子的AMDGPU适配版本,利用ROCm生态特性(如MIOpen、rocBLAS)解决“算子拆分执行”的内存带宽浪费问题,将注意力机制计算效率提升50%以上。性能突破:针对PyTorch原生算子






