吉梦智创开发者
4天前在线
全职 · 1000/日  ·  21750/月
工作时间: 工作日20:00-00:00、周末08:00-22:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的【吉梦智创开发者】,一名【AI全栈工程师】;

教育经历

2022-09-01 - 2026-07-01 吉林大学 计算机科学与技术(在读)

工作经历

2024-01-01 - 2025-04-26 吉梦智创 · 开发工程师(AI方向)

参与大模型(LLM)的落地部署与微调,优化模型在业务场景中的推理效率。开发计算机视觉基础应用模块,支持图像分类、目标检测等任务。主导RAG(检索增强生成)技术调研,完成框架选型、核心模块开发及实际业务场景落地。

负责项目

大模型微调与落地:基于业务需求微调开源大模型(如LLaMA),部署至生产环境并优化推理性能。RAG系统开发:搭建检索增强生成框架,集成向量数据库与生成模型,提升问答系统准确率。计算机视觉应用:开发轻量级CV模块,支持边缘设备部署。

技术栈

编程语言:Java(4/5)前端框架:Vue(4/5)深度学习:PyTorch(4/5)大模型工具链:Hugging Face Transformers、LangChain部署运维:Docker、FastAPI

我能为您做什么?

大模型应用:微调、部署、RAG系统搭建。全栈开发:从前端(Vue)到后端(Java/Python)的AI功能闭环实现。快速落地:提供从技术调研到生产部署的一站式解决方案。

立即预约发布需求,让技术与业务无缝衔接!

工作经历

  • 2024-01-01 -2025-04-26吉梦智创开发

    参与大模型的落地、微调,以及计算机视觉部分的简单应用与开发,参与了RAG项目的调研与实际落地

教育经历

  • 2022-09-01 - 2026-07-01吉林大学计算机科学与技术本科

语言

普通话
0
1
2
3
4
5
0
1
2
3
4
5

技能

Vue
Torch
0
1
2
3
4
5
0
1
2
3
4
5
作品
RegisterRAG

传统检索增强生成(RAG)框架搭建复杂,需大量代码调整和组件适配。RegisterRAG 旨在通过 JSON 配置文件 快速构建灵活、可扩展的 RAG 流程,解决以下痛点: 开发效率低:无需重复编写模块化代码,通过配置即可定义嵌入模型、存储方案、生成模型等核心组件。 灵活性不足:支持动态替换组件(如切换向量数据库/大语言模型),适配不同场景需求(如本地轻量部署或云端高性能场景)。 学习成本高:提供开箱即用的配置模板和可视化面板,降低开发者上手门槛。 项目基于模块化设计,关键技术选型聚焦高效性与扩展性: 核心框架: 嵌入模块:集成主流模型(如 Sentence-BERT、OpenAI Embeddings),支持 GPU 加速。 存储模块:兼容多种向量数据库(如 FAISS、Milvus),支持本地/分布式存储。 生成模块:对接主流大模型(如 GPT、LLaMA),提供统一的生成接口。 辅助工具链: 配置驱动:通过 JSON 定义流水线,支持参数级细粒度控制(如 chunk 大小、相似度阈值)。 部署适配: 轻量化依赖(仅需 pip install),支持纯 CPU 或 GPU 环境;提供测试套件(pytest)保障稳定性。 快速上手(30%) 3 步开启 RAG 流程: 安装与配置: pip install register_rag # 或源码安装 编写 JSON 配置文件(示例见项目 Wiki),定义嵌入模型、向量库、生成模型等。 初始化流水线: from register_rag import Pipeline pipeline = Pipeline("config.json") # 自动加载模块 调用与扩展: python 复制 # 直接使用预置模块 results = pipeline.search("你的问题") # 或自定义组件(如替换 Hugging Face 模型) pipeline.embedding = CustomEmbedder() 进阶:通过 Dashboard().launch() 启动可视化面板调试流程。

0
2025-04-26 21:26
更新于: 4天前 浏览: 4