丛林幻影
9天前在线
全职 · 600/日  ·  13050/月
工作时间: 工作日19:00-22:00、周末08:00-21:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的【流码李哥】,一名【算法与高性能优化工程师】; 我毕业于【复旦大学MSE】,担任过【紫光华智】的【算法工程师】,担任过【中科曙光】的【异构优化工程师】; 负责过【智能安防算法优化】,【大模型算子优化库】,【大模型通信优化】的开发; 熟练使用【pytorch】,【C++】,【cuda】,【git】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2022-08-01 -至今中科曙光信息产业异构计算工程师

    中科曙光是国内领先的信息基础设施与智能计算解决方案提供商,核心业务聚焦 “算力基础设施构建 + AI 全栈生态赋能”,具体包括: 智算硬件研发:推出 scaleX640 超节点等高性能智算集群,通过算、存、网、电、冷一体化紧耦合设计,支撑 MoE 万亿参数大模型训练与推理场景。 软件平台打造:发布 OneScience 科学大模型一站式开发平台,集成多领域热点模型与工具链,赋能 AI for Science(科学智能)等前沿场景。 生态协同建设:主导 “AI 计算开放架构”,联合产业链企业构建软硬协同的国产智算生态,支持多品牌加速卡与主流计算生态兼容。 行业解决方案:为科研机构、政企客户提供从算力部署到模型开发的全流程服务,覆盖气象、生物、金融等多个领域的智能化转型需求。 我主要负责,大模型相关算子优化、算子融合、通信库性能优化,训练与推理的框架对接等 1、大模型相关算子优化 针对大模型核心算子(如flashattention、矩阵乘、激活函数等),结合公司智算硬件特性(如超高速总线、高密度计算单元)进行底层优化。 适配 FP8 等混合精度计算方案,在保障模型精度的前提下,提升算子计

  • 2021-02-01 -2022-06-30新华智云科技有限公司算法工程师

    媒体领域:“媒体大脑” 平台是全国首个 AI 媒体平台。平台推出了 MAGIC 短视频智能生产平台,集成了众多媒体机器人,如突发识别机器人、人脸追踪机器人、智能配音机器人、视频包装机器人等,可帮助新闻工作者更高效地采集、处理和发布新闻资源。 文旅领域:“文化数字化操作系统”是全国首个 AI 文旅融合平台,通过整合文化和旅游资源,运用人工智能技术实现文化资源的数字化展示、传播和旅游服务的智能化升级。 其他还有金融领域、MCN领域等 我的工作是为为媒体机器人和文旅AI互动提供算法支持,包括深度估计、图像清晰度增强、语音识别、语音生成等

  • 2019-02-01 -2020-11-01重庆紫光华智科技有限公司算法工程师

    公司聚焦于智算服务器、数图融合存储、智能终端和智慧大屏等核心基础设施的研发与生产。同时,全面推出算法产品、前端产品、视图存储、微云服务器、显示与控制、边缘计算、融合产品、软件应用产品系列。 我主要参与其中核心AI算法产品研发,边缘计算的产品对接工作

教育经历

  • 2021-09-01 - 2025-06-30复旦大学软件工程硕士

  • 2013-09-01 - 2017-06-30华北电力大学(北京))电气工程及其本科

语言

中文母语水平
英语可口语交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

C++精通
C熟练
Torch精通
0
1
2
3
4
5
0
1
2
3
4
5
作品
cuda算子优化库

核心业务目标算子支持:实现FlashAttention、Grouped-QueryAttention等融合算子的AMDGPU适配版本,利用ROCm生态特性(如MIOpen、rocBLAS)解决“算子拆分执行”的内存带宽浪费问题,将注意力机制计算效率提升50%以上。性能突破:针对PyTorch原生算子

0
2025-11-10 14:28
基于双目视觉的深度估计

视觉数据采集模块:负责获取单目/双目相机的原始图像数据,支持实时视频流采集或离线图像序列导入。包含相机参数校准(内参、外参)功能,修正镜头畸变,为后续深度计算提供精准基础数据。支持图像预处理(去噪、曝光校正、白平衡调整),提升原始数据质量,减少环境干扰。深度估计模块:双目视觉分支,通过结合神经网络和

0
2025-11-10 11:10
更新于: 11-10 浏览: 72