llm测评hu
3小时前在线
全职 · 350/日  ·  7612/月
工作时间: 工作日09:00-20:00、周末00:00-00:00工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

本人专注 LLM RLHF 多模型自动化评测交付,拥有完整可复现 Docker 推理流水线,;支持 Qwen、Llama3、Mistral、GLM4、Yi 五款开源 7B 量化模型批量串行推理,内置显存自动回收逻辑。

可完成全套业务闭环:自定义 Prompt 批量推理、0/1/2 分级人工标注 + 双层质检、一键导出 RLHF 训练 JSONL 数据集、自动生成模型得分排名分析报告,所有文件打包飞书归档交付客户。

支持通用、代码、行业垂类场景评测,可提供免费 5 条 Prompt 小样测试,项目分阶段资金托管交付,日薪 300 元 / 8 小时远程,可承接工作日、周末外包订单。

工作经历

  • 2025-06-01 -至今AI 自由技术工作室大模型评测工程师

    独立承接 LLM RLHF 自动化评测外包业务,搭建 Docker 容器化批量推理流水线,基于 PyTorch 完成 7B 模型 4bit 量化推理、Prompt 批量生成、标准化 0/1/2 偏好打分、RLHF 训练数据集输出,为 AI 初创团队提供完整离线标注交付方案,配套生成多模型效果分析报告。 填完点保存。

教育经历

  • 2024-09-01 - 东北大学计算机本科

语言

中文母语水平
英语可口语交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

Python熟练
Docker掌握
Torch掌握
0
1
2
3
4
5
0
1
2
3
4
5
作品
LLM RLHF多模型批量评测自动化交付系统(Docker离线推理打分流水线)

DockerCompose封装GPU推理环境,支持WindowsWSL2显卡直通,一键完成CUDA、模型依赖部署;基于PyTorch实现5款量化大模型串行批量推理,内置显存自动回收逻辑,;导入自定义Prompt集合自动生成全部模型回答,导出可编辑Excel打分表;标准化0/1/2人工打分、双层质检,

0
2026-06-17 23:14
更新于: 2小时前 浏览: 2