proginn1518315141
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的李响,3D生成与多模态AI的高级算法工程师。曾在深圳鹿影科技(商汤系)担任AIGC算法实习生,负责图生成、美学优化、分布式训练等核心任务。

北京大学研究生,研究方向为3D Generation与Gaussian Splatting,已在国际会议COLING发表2篇论文。

我参与并主导了多个项目的开发,包括基于VSD损失与Gaussian Splatting的3D内容生成框架、轻量级鸟类音频识别系统、动态稀疏注意力机制语音识别模型、以及异常行为检测系统等。

熟练掌握Pytorch、DeepSpeed、Diffusion Models、KD-tree算法、Mel频谱图处理与多模态任务设计等技术栈,具备从算法研究到工程落地的完整能力链条。

如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2024-04-07 -2024-09-30鹿影科技算法工程师

    • 负责图生成算法研究以及图模型美学优化; • 图生成算法训练策略研究和落地; • 分布式训练框架 deepspeed 的部署; • 负责部分视频数据的爬取,视频质量优化,提出的 tag 标注策略极大扩大了视频数据集; • 视频生成工程上的优化-超分、平滑插帧等; • edm 论文采样策略在本项目上的扩充和实验; • discord 服务器部署文生视频,图生视频 app。

教育经历

  • 2024-09-01 - 北京大学电子信息博士

  • 2020-09-01 - 2024-06-30哈尔滨工程大学计算机科学与技术本科

技能

Django熟练
Java熟练
Torch精通
0
1
2
3
4
5
0
1
2
3
4
5
更新于: 2025-04-08 浏览: 12