CDMLBPython-程序员客栈

1月前来过

计算机视觉算法工程师

昆明

全职 · 300/日 · 6525/月信用一般

工作时间: 工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

我是程序员客栈的CDMLB，一名AI算法与后端开发工程师；

我就读于昆明理工大学（硕士在读），专注于计算机视觉与多模态大模型；

负责过基于微调大模型的视觉定位系统、开放域图像智能检索系统的开发；

熟练使用Python，PyTorch，Transformers，Flask，PEFT/LoRA；

如果我能帮上您的忙，请点击"立即预约"或"发布需求"！

2024-09-18 -2025-10-18云南省人工智能重点实验室计算机视觉算法工程师
云南省人工智能重点实验室主要业务：云南省人工智能重点实验室是依托昆明理工大学建设的省级重点实验室，其核心工作是面向南亚东南亚语言开展自然语言处理与机器翻译、信息检索与社会计算、语音识别与合成、图像识别与检索等多个方向的研究。在图像领域，实验室不仅专注于图像识别、图像检索、图像增强、图像融合及机器视觉等基础研究，还将其应用于实践，例如研发了面向南亚东南亚语言的图像文字识别平台和配套的软硬件产品，以解决实际场景中的文字信息提取问题。我的核心职责：参与实验室在图像识别与检索方向的算法研发，专注于将前沿大模型技术应用于解决复杂场景下的视觉定位与理解问题。我的工作内容：多模态大模型研发与优化：负责基于Qwen2.5-VL等开源大模型，利用LoRA等参数高效微调技术，对模型进行领域适配，显著提升其在开放域环境下的目标识别与定位精度。算法工程化与服务部署：主导研发算法的落地应用，使用Flask框架将训练好的视觉模型封装成高可用Web API服务，实现研究成果向原型系统的快速转化。跨模态技术应用探索：参与实验室的跨模态项目（如结合视觉与文本的多语言图文识别系统），负责其中的视觉算法模块，

2024-09-08 - 昆明理工大学计算机应用技术硕士
研究方向为多模态大模型，聚焦视觉识别与定位。精通PyTorch、Transformers框架，具有利用LoRA进行参数高效微调的实战经验，并能使用Flask将AI模型封装成Web API服务，实现算法能力的工程化落地。具备从算法研发到服务部署的端到端实践能力。

中文母语水平

Flask熟练

SQL Server熟练

Java熟练

Torch熟练

C++精通

Python精通

openCV精通

作品

基于LoRA微调的多模态大模型开放域视觉定位系统

开放域视觉定位：支持通过自然语言指令，在图像中定位任意指定的物体、人物或场景元素。思维链增强推理：利用大模型的内在推理能力，通过多步思考提升复杂场景下的定位准确性。参数高效微调：采用LoRA技术对Qwen2.5-VL-7B模型进行微调，仅训练少量参数即可显著提升在目标领域的效果。完整训练流水线：实现

2025-10-28 01:38

更新于: 2025-10-28 浏览: 84

个人介绍

工作经历

教育经历

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐