RyanYin
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作地点: 远程
服务企业: 0家累计提交: 0工时
聊一聊

APP聊一聊

个人介绍

我是程序员客栈的【Jiahao】,一名【AI / NLP / 大模型算法方向】工程师;

我毕业于【计算机相关专业】,曾在【北京智谱华章科技有限公司】担任大模型算法工程师,在【拓尔思信息技术股份有限公司】担任 NLP 算法工程师;

参与并负责过【报关单证多模态信息抽取系统】【银行金融研报自动生成平台】【RAG 问答与模型推理优化】等项目的算法研发;

熟练使用【Python】【PyTorch】【大语言模型微调(LoRA / DPO)】【RAG 与向量检索】【Prompt Engineering / vLLM / DeepSpeed】等技术栈;

如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2024-08-16 -至今拓尔思信息技术股份有限公司NLP算法工程师

    公司主要业务: 拓尔思信息技术股份有限公司是一家专注于大数据、自然语言处理与人工智能技术的企业,长期服务于金融、政务等行业客户,提供智能信息处理、文本分析、知识管理及智能决策相关解决方案。在金融领域,公司围绕研究报告、资讯分析与投研辅助,构建自动化、智能化的信息服务平台。 本人职责与工作内容: 在第三研发中心担任 NLP 算法工程师,目前主要参与银行金融报告自动生成服务平台的研发工作。项目面向银行研究部门的研报撰写与资料溯源需求,打通“PDF 解析 → 知识库构建 → 模型对齐 → RAG 检索 → 人审发布”的完整业务链路。 具体工作包括:负责领域语料的清洗与指令构建,产出高质量样本;基于 DeepSeek-R1,结合 DeepSpeed 与 LoRA 完成 SFT 微调,并在小样本场景下引入 DPO 偏好对齐。同时负责 RAG 检索模块优化,通过意图识别与文本分块策略改进。此外,设计 CoT Prompt 模板并基于 vLLM 完成模型部署,显著优化推理性能。

  • 2024-03-01 -2024-08-08北京智谱华章科技有限公司大模型算法工程师

    公司主要业务: 北京智谱华章科技有限公司政府事务部专注于通用大模型与行业级AI解决方案的研发与落地,面向政企客户提供大模型算法能力、智能文档处理、信息抽取与结构化分析等技术服务,推动大模型在政务与企业场景中的实际应用。 本人职责与工作内容: 在政府客户事务部担任大模型算法工程师,参与集团报关单证识别项目。通过多模态与语言大模型结合,搭建 VLM + OCR + LLM 的整体处理 pipeline,实现报关场景下单证结构化信息的高质量抽取与要素匹配,覆盖提单、商业发票、装箱单等多类模板及低质扫描件。 具体工作包括:设计并优化图像预处理流程(去噪、几何校正)以提升 OCR 稳定性;基于 CogVLM 设计版面感知 Prompt,并结合 few-shot 提升复杂文档解析能力;构建符合业务需求的 JSON Schema,优化 GLM 解析类 Prompt 的准确性与鲁棒性。通过持续测试与迭代,商品信息 micro-F1 提升至约 89%,申报要素 micro-F1 约 85%,TEDS 指标提升约 12%。

教育经历

  • 2023-09-01 - 北京科技大学计算机学院硕士

  • 2019-09-01 - 2023-06-01江西理工大学软件工程本科

语言

中文母语水平
英语无工具书面交流
0
1
2
3
4
5
0
1
2
3
4
5

技能

Python熟练
Docker掌握
Torch熟练
0
1
2
3
4
5
0
1
2
3
4
5
更新于: 2025-12-15 浏览: 7