个人介绍
我是程序员客栈的李响,3D生成与多模态AI的高级算法工程师。曾在深圳鹿影科技(商汤系)担任AIGC算法实习生,负责图生成、美学优化、分布式训练等核心任务。
北京大学研究生,研究方向为3D Generation与Gaussian Splatting,已在国际会议COLING发表2篇论文。
我参与并主导了多个项目的开发,包括基于VSD损失与Gaussian Splatting的3D内容生成框架、轻量级鸟类音频识别系统、动态稀疏注意力机制语音识别模型、以及异常行为检测系统等。
熟练掌握Pytorch、DeepSpeed、Diffusion Models、KD-tree算法、Mel频谱图处理与多模态任务设计等技术栈,具备从算法研究到工程落地的完整能力链条。
如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2024-04-07 -2024-09-30鹿影科技算法工程师
• 负责图生成算法研究以及图模型美学优化; • 图生成算法训练策略研究和落地; • 分布式训练框架 deepspeed 的部署; • 负责部分视频数据的爬取,视频质量优化,提出的 tag 标注策略极大扩大了视频数据集; • 视频生成工程上的优化-超分、平滑插帧等; • edm 论文采样策略在本项目上的扩充和实验; • discord 服务器部署文生视频,图生视频 app。
教育经历
2024-09-01 - 北京大学电子信息博士
2020-09-01 - 2024-06-30哈尔滨工程大学计算机科学与技术本科


