个人介绍
本人对前沿技术非常感兴趣,本人在深度学习算法领域工作9年工作经验(图像/nlp)期间专注于深度学习领域的算法 研究(目标检测,图像分割, ocr文本识别,nlp任务,大模型微调任务, llm+agent开发。擅长把最新论文的架构嫁接到 公司业务场景,擅长模型加速,蒸馏,剪枝,量化,AI业务领域模型构建与优化。训练过大量的检测,分类,识别,大 模型微调等模型。
1 熟悉c++,熟练使用python,熟练使用深度学习框架tensorflow,pytorch,paddle等。
2 熟悉常见的开源大模型:chatglm,LLama,qwen,deepseek等网络结构。
3 熟练使用各大平台的Ai工具,qwen,deepseek,豆包,即梦AI等。
4 熟练掌握主流大模型结构以及微调,训练,全量参数训练技术技巧。
5 熟练使用docker进行服务部署以及开发。
6 熟练使用tensorRT 模型量化 对模型部署和加速做过一整套方案。
7 transformer 架构 嵌入图像分类,ocr识别,目标检测等。
8 熟练掌握llm+agent开发 架构,感知,思考,动作,记忆。多智能体调度。
9 熟练掌握deepspeed训练框架,单机多卡,多机多卡大语言模型微调训练。
10 完成绝吴恩达AI智能体,llm课程的学习
部分自己的项目开源至 :http://github.com/pureloveljc
邮箱:pureloveljc@gmail.com
工作经历
2023-12-01 -2026-01-13苏州科德大模型开发工程师
● 知识库+LLM整合:主导了一个结合专有知识库与大型语言模型的检索增强生成框架的整合,提供精确、上下文相关 的答案。rag方案。实现混合检索策略。faiss+关键词匹配等方法。 ● 对话管理系统:开发了一个能够处理复杂多轮互动的健壮对话管理系统,显著提升了模型响应的自然性和相关性。 ● 意图抽取模型:训练开发 信息抽取,命名实体识别,分词,文本匹配等NlP任务。 ● AI驱动的FastAPI服务:设计并推出了FastAPI restful服务,这些服务能够动态选择基于知识的响应和生成模型输出 ,优化了计算资源和响应精确度。 ● 使用LLama-factory框架训练微调职业教育领域的知识点数据以及大模型合成的数据。70B的deepseek,qwen3 32B 模型上做微调。 ● 垂类大规模数据大模型微调训练部署 应用开发,下游任务迁移,知识融入更新,模型性能量化提升。运用过Finetuning,loar,peft大模型通用的微调手段。深入了解各种微调手段的优劣势,将业界SOTA模型落地改进。巨有千亿数据规模训练经验。
2018-09-30 -2023-11-30上海西井科技算法工程师
1 开发 tensorflow flask 服务 深度学习部署模型框架。为工程应用做云服务部署。 2 用tensorflow,darknet 框架 开发包括 车牌,集卡号,固定场景的模型训练以及优化。高效,准确的识别客户所需的目标识别, 准确率98%。 3 研究最前沿算法yolo系列, centernet2 在港口智能化场景的使用。 4 利用mask rcnn模型 完成自动驾驶车道线检测(图像分割)等项目,并达到30fps。 5 幼儿园人脸识别项目,行人区域检测项目设计开发以及部署上线。 6 agv小车二维码导航算法实现 基于英伟达Ai开发板 NVIDIA Jetson agx和nx 和深度相机,实现yolov4-tiny模型 并用tensorRT加速 达到30fps,3060卡通过tensorRT加速可达150fps. 7agv机器臂抓取所需物体的视觉分割算法 基于mobilenetv3 分割网络 (由于板卡算力限制 所以使用轻量级分割网络) 达到30fps(嵌入式开发板). 8 paddleocr 实现ocr检测和识别任务 实现法律文件的识别. 9 单线激光雷达 点云数据 分割
教育经历
2012-09-01 - 2016-09-01齐鲁理工学院计算机科学与技术本科







