proginn1406549242
1月前来过
全职 · 260/日  ·  5655/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

应用统计学本科毕业,具备近一年的大模型算法工程师全职工作经验。工作期间深度参与了大模型应用落地全流程,涵盖文本分类、RAG知识库搭建、Agent多智能体协作等核心模块。性格细致严谨,具备较强的逻辑分析与问题拆解能力,善于在工程实践中平衡模型效果与资源消耗。目前寻求兼职或远程协作机会,可灵活安排工作时间,确保项目按期高质量交付。

技术栈

大模型框架与工具:熟悉 Qwen、DeepSeek、ChatGLM、BERT 等主流模型的使用与微调;熟练运用 LangChain 构建问答链与 Agent 流程;掌握 LoRA/QLoRA 等高效微调方法。

RAG 检索增强:精通文档解析(PyMuPDF、OCR)、语义切分(AliTextSplitter)、向量化(BGE-M3)、混合检索与重排序(BGE-Reranker)全链路技术;熟练使用 Milvus 向量数据库与 Redis 缓存加速。

工程化部署:能够基于 FastAPI/Flask 构建 RESTful 与 SSE 流式接口;掌握 Docker 容器化部署与 MySQL/Redis 协同服务搭建。

多模态与推理加速:了解扩散模型与 GAN 原理;熟悉模型量化、KV Cache 优化及 DeepSpeed 推理加速框架。

可提供服务

RAG 知识库问答系统搭建:面向企业私有知识库、产品手册、教育课件等场景,提供从文档清洗、向量入库、检索优化到大模型生成的一站式开发服务。

大模型微调与行业适配:针对特定领域术语与话术,提供基于 LoRA/QLoRA 的指令微调服务,提升模型在垂直场景下的回答准确率。

Agent 智能体开发:基于 LangChain 或 A2A 协议,开发具备工具调用、记忆管理与多智能体协作能力的任务型对话系统。

模型推理部署与加速:提供模型量化、Docker 封装及 API 服务部署,降低推理成本,满足生产环境上线需求。

NLP 文本分类与信息抽取:承接新闻分类、情感分析、实体识别等传统 NLP 任务,兼顾模型精度与推理效率。

工作经历

  • 2025-03-17 -2026-05-17星璇电子科技有限公司nlp算法工程师

    在职期间主要负责三大方向:一是构建传统机器学习模型与NLP文本分类模型,通过数据增强与知识蒸馏将Bert分类效率提升3倍;二是独立搭建基于RAG的多模态智能问答系统,实现文档OCR解析、混合检索与流式对话管理,上线后自动应答率超80%;三是探索Agent多智能体协作机制,完成工具

教育经历

  • 2021-09-01 - 2025-06-17安徽农业大学应用统计学本科

    2021年9月至2025年6月就读于安徽农业大学应用统计学专业,获理学学士学位。在校期间系统学习了高等数学、概率论与数理统计、回归分析、多元统计分析、数据挖掘与机器学习等核心课程,奠定了扎实的数理统计与算法理论基础。专业培养的量化分析思维与数据建模能力,与当前大模型算法工程师所需

  • 2021-09-01 - 2025-06-17安徽农业大学应用统计学本科

    2021年9月至2025年6月就读于安徽农业大学应用统计学专业,获理学学士学位。在校期间系统学习了高等数学、概率论与数理统计、回归分析、多元统计分析、数据挖掘与机器学习等核心课程,奠定了扎实的数理统计与算法理论基础。专业培养的量化分析思维与数据建模能力,与当前大模型算法工程师所需

技能

Python熟练
0
1
2
3
4
5
更新于: 04-17 浏览: 4