吉梦智创开发者人工智能-程序员客栈

1月前来过

D级

开发

长春

全职 · 1000/日 · 21750/月信用一般

工作时间: 工作日20:00-00:00、周末08:00-22:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

我是程序员客栈的【吉梦智创开发者】，一名【AI全栈工程师】；

教育经历

2022-09-01 - 2026-07-01 吉林大学计算机科学与技术（在读）

工作经历

2024-01-01 - 2025-04-26 吉梦智创 · 开发工程师（AI方向）

参与大模型（LLM）的落地部署与微调，优化模型在业务场景中的推理效率。开发计算机视觉基础应用模块，支持图像分类、目标检测等任务。主导RAG（检索增强生成）技术调研，完成框架选型、核心模块开发及实际业务场景落地。

负责项目

大模型微调与落地：基于业务需求微调开源大模型（如LLaMA），部署至生产环境并优化推理性能。RAG系统开发：搭建检索增强生成框架，集成向量数据库与生成模型，提升问答系统准确率。计算机视觉应用：开发轻量级CV模块，支持边缘设备部署。

技术栈

编程语言：Java（4/5）前端框架：Vue（4/5）深度学习：PyTorch（4/5）大模型工具链：Hugging Face Transformers、LangChain部署运维：Docker、FastAPI

我能为您做什么？

大模型应用：微调、部署、RAG系统搭建。全栈开发：从前端（Vue）到后端（Java/Python）的AI功能闭环实现。快速落地：提供从技术调研到生产部署的一站式解决方案。

立即预约或发布需求，让技术与业务无缝衔接！

2024-01-01 -2025-04-26吉梦智创开发
参与大模型的落地、微调，以及计算机视觉部分的简单应用与开发，参与了RAG项目的调研与实际落地

2022-09-01 - 2026-07-01吉林大学计算机科学与技术本科

普通话母语水平

Java掌握

Vue掌握

Torch掌握

作品

RegisterRAG

传统检索增强生成（RAG）框架搭建复杂，需大量代码调整和组件适配。RegisterRAG 旨在通过 JSON 配置文件快速构建灵活、可扩展的 RAG 流程，解决以下痛点：开发效率低：无需重复编写模块化代码，通过配置即可定义嵌入模型、存储方案、生成模型等核心组件。灵活性不足：支持动态替换组件（如切换向量数据库/大语言模型），适配不同场景需求（如本地轻量部署或云端高性能场景）。学习成本高：提供开箱即用的配置模板和可视化面板，降低开发者上手门槛。项目基于模块化设计，关键技术选型聚焦高效性与扩展性：核心框架：嵌入模块：集成主流模型（如 Sentence-BERT、OpenAI Embeddings），支持 GPU 加速。存储模块：兼容多种向量数据库（如 FAISS、Milvus），支持本地/分布式存储。生成模块：对接主流大模型（如 GPT、LLaMA），提供统一的生成接口。辅助工具链：配置驱动：通过 JSON 定义流水线，支持参数级细粒度控制（如 chunk 大小、相似度阈值）。部署适配：轻量化依赖（仅需 pip install），支持纯 CPU 或 GPU 环境；提供测试套件（pytest）保障稳定性。快速上手（30%） 3 步开启 RAG 流程：安装与配置： pip install register_rag # 或源码安装编写 JSON 配置文件（示例见项目 Wiki），定义嵌入模型、向量库、生成模型等。初始化流水线： from register_rag import Pipeline pipeline = Pipeline("config.json") # 自动加载模块调用与扩展： python 复制 # 直接使用预置模块 results = pipeline.search("你的问题") # 或自定义组件（如替换 Hugging Face 模型） pipeline.embedding = CustomEmbedder() 进阶：通过 Dashboard().launch() 启动可视化面板调试流程。

2025-04-26 21:26

更新于: 2025-04-26 浏览: 321

个人介绍

工作经历

教育经历

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐