recardot
2天前在线
全职 · 800/日  ·  17400/月
工作时间: 工作日09:30-22:30、周末09:30-22:30工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的recardot,一名人工智能方向开发者;我毕业于东北大学,担任过智域星云人工智能工作室的 AI 算法实习生,担任过极构智能研发小组的大模型开发实习生;负责过 AI 学术论文翻译器、LoRA 大模型微调工具、LangChain 智能体工作流的开发;熟练使用 Python、PyTorch、大模型微调、LoRA/QLoRA、冻结基座训练、模型权重指针调度、RAG 检索增强、LangChain、AI Agent、FastAPI 部署、HuggingFace Transformers、向量数据库;

工作经历

  • 2025-11-01 -2026-02-01极构智能研发小组大模型开发实习生

    清洗并构建垂直领域数据集,负责微调前的数据划分与预处理脚本编写。 使用 PyTorch 监控训练 Loss,调优 LoRA 超参,规避模型通用能力遗忘。 用 FastAPI 封装推理接口,完成本地化部署,支持离线调用模型能力。

  • 2025-07-01 -2025-11-01智育ai算法实习生

    参与大模型垂类微调,采用 LoRA 方案,冻结基座权重,仅更新低秩参数,降低训练显存消耗。 编写权重加载逻辑,实现模型指针调用,动态切换原始基座与微调 LoRA 分支。 基于 RAG 搭建学术文档检索流程,优化论文向量化与召回,辅助专业翻译场景落地。

教育经历

  • 2022-09-01 - 2026-03-01东北大学计算机科学与技术本科

语言

英语专业级流畅
0
1
2
3
4
5

技能

Python熟练
HTML5熟练
Torch熟练
Spark熟练
0
1
2
3
4
5
0
1
2
3
4
5
作品
论文翻译

基座冻结训练:冻结大模型基底权重,仅开放部分参数参与训练,降低显存开销,避免通用能力灾难性遗忘。LoRA参数微调:使用低秩矩阵对模型做垂直微调,定向学习计算机学术论文句式与专业术语,强化学术翻译精度。模型指针调用:设计模型权重指针映射,动态指向微调后的LoRA分支与原始基座分支,按需切换推理权重。R

0
2026-04-09 16:21
更新于: 2天前 浏览: 2