




个人介绍
我是程序员客栈的【吉梦智创开发者】,一名【AI全栈工程师】;
教育经历
2022-09-01 - 2026-07-01 吉林大学 计算机科学与技术(在读)
工作经历
2024-01-01 - 2025-04-26 吉梦智创 · 开发工程师(AI方向)
参与大模型(LLM)的落地部署与微调,优化模型在业务场景中的推理效率。开发计算机视觉基础应用模块,支持图像分类、目标检测等任务。主导RAG(检索增强生成)技术调研,完成框架选型、核心模块开发及实际业务场景落地。负责项目
大模型微调与落地:基于业务需求微调开源大模型(如LLaMA),部署至生产环境并优化推理性能。RAG系统开发:搭建检索增强生成框架,集成向量数据库与生成模型,提升问答系统准确率。计算机视觉应用:开发轻量级CV模块,支持边缘设备部署。技术栈
编程语言:Java(4/5)前端框架:Vue(4/5)深度学习:PyTorch(4/5)大模型工具链:Hugging Face Transformers、LangChain部署运维:Docker、FastAPI我能为您做什么?
大模型应用:微调、部署、RAG系统搭建。全栈开发:从前端(Vue)到后端(Java/Python)的AI功能闭环实现。快速落地:提供从技术调研到生产部署的一站式解决方案。立即预约或发布需求,让技术与业务无缝衔接!
工作经历
2024-01-01 -2025-04-26吉梦智创开发
参与大模型的落地、微调,以及计算机视觉部分的简单应用与开发,参与了RAG项目的调研与实际落地
教育经历
2022-09-01 - 2026-07-01吉林大学计算机科学与技术本科
语言
技能

传统检索增强生成(RAG)框架搭建复杂,需大量代码调整和组件适配。RegisterRAG 旨在通过 JSON 配置文件 快速构建灵活、可扩展的 RAG 流程,解决以下痛点: 开发效率低:无需重复编写模块化代码,通过配置即可定义嵌入模型、存储方案、生成模型等核心组件。 灵活性不足:支持动态替换组件(如切换向量数据库/大语言模型),适配不同场景需求(如本地轻量部署或云端高性能场景)。 学习成本高:提供开箱即用的配置模板和可视化面板,降低开发者上手门槛。 项目基于模块化设计,关键技术选型聚焦高效性与扩展性: 核心框架: 嵌入模块:集成主流模型(如 Sentence-BERT、OpenAI Embeddings),支持 GPU 加速。 存储模块:兼容多种向量数据库(如 FAISS、Milvus),支持本地/分布式存储。 生成模块:对接主流大模型(如 GPT、LLaMA),提供统一的生成接口。 辅助工具链: 配置驱动:通过 JSON 定义流水线,支持参数级细粒度控制(如 chunk 大小、相似度阈值)。 部署适配: 轻量化依赖(仅需 pip install),支持纯 CPU 或 GPU 环境;提供测试套件(pytest)保障稳定性。 快速上手(30%) 3 步开启 RAG 流程: 安装与配置: pip install register_rag # 或源码安装 编写 JSON 配置文件(示例见项目 Wiki),定义嵌入模型、向量库、生成模型等。 初始化流水线: from register_rag import Pipeline pipeline = Pipeline("config.json") # 自动加载模块 调用与扩展: python 复制 # 直接使用预置模块 results = pipeline.search("你的问题") # 或自定义组件(如替换 Hugging Face 模型) pipeline.embedding = CustomEmbedder() 进阶:通过 Dashboard().launch() 启动可视化面板调试流程。
