llm测评hu人工智能-程序员客栈

3小时前在线

D级

大模型评测工程师

全职 · 350/日 · 7612/月信用正常

工作时间: 工作日09:00-20:00、周末00:00-00:00工作地点: 远程

服务企业: 0家累计提交: 0工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

本人专注 LLM RLHF 多模型自动化评测交付，拥有完整可复现 Docker 推理流水线，；支持 Qwen、Llama3、Mistral、GLM4、Yi 五款开源 7B 量化模型批量串行推理，内置显存自动回收逻辑。

可完成全套业务闭环：自定义 Prompt 批量推理、0/1/2 分级人工标注 + 双层质检、一键导出 RLHF 训练 JSONL 数据集、自动生成模型得分排名分析报告，所有文件打包飞书归档交付客户。

支持通用、代码、行业垂类场景评测，可提供免费 5 条 Prompt 小样测试，项目分阶段资金托管交付，日薪 300 元 / 8 小时远程，可承接工作日、周末外包订单。

2025-06-01 -至今AI 自由技术工作室大模型评测工程师
独立承接 LLM RLHF 自动化评测外包业务，搭建 Docker 容器化批量推理流水线，基于 PyTorch 完成 7B 模型 4bit 量化推理、Prompt 批量生成、标准化 0/1/2 偏好打分、RLHF 训练数据集输出，为 AI 初创团队提供完整离线标注交付方案，配套生成多模型效果分析报告。填完点保存。

2024-09-01 - 东北大学计算机本科

中文母语水平

英语可口语交流

Python熟练

Docker掌握

Torch掌握

作品

LLM RLHF多模型批量评测自动化交付系统（Docker离线推理打分流水线）

DockerCompose封装GPU推理环境，支持WindowsWSL2显卡直通，一键完成CUDA、模型依赖部署；基于PyTorch实现5款量化大模型串行批量推理，内置显存自动回收逻辑，；导入自定义Prompt集合自动生成全部模型回答，导出可编辑Excel打分表；标准化0/1/2人工打分、双层质检，

2026-06-17 23:14

更新于: 2小时前浏览: 2

个人介绍

工作经历

教育经历

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐