奇文王语-北京人工智能-程序员客栈

1月前来过

D级

数据研发工程师

北京

全职 · 800/日 · 17400/月信用正常

工作时间: 工作日09:00-23:00工作地点: 远程

服务企业: 10家累计提交: 1工时

立即雇佣

聊一聊

APP聊一聊

去下载APP

主页

一、个人简介

毕业于中国科学院大学，主要研究方向是机器学习和自然语言处理。先后在百度，斯伦贝谢、shopee等公司做过NLP高级研发工程师。研发过对话机器人系统和AI中台系统。

二、大模型技术能力

1. 具备丰富的大模型落地应用经验，能够结合实际业务场景将大模型技术应用于公文写作、Text2SQL 转换、标书生成等多个方向，推动业务智能化升级。

2. 熟悉主流大模型体系，包括 DeepSeek-R1、Qwen3、ChatGLM 等，掌握其在训练、推理、私有化部署以及国产化环境适配等方面的实践方法和优化策略。

3. 深入理解大模型训练与调优技术，熟练掌握增量预训练、全量微调、LoRA 轻量化训练、强化学习（如基于人类反馈的强化学习 RLHF）等关键技术路径，具备较强的工程实践能力和模型优化能力。

4. 熟悉大模型与国产化服务器的适配（昇腾910B、300Iduo、智凯v100、曙光k100等）

5. 熟悉国产化大模型在标书、公文、text2sql等公文领域的落地应用。

三、自然语言处理能力

1. 熟悉语言学基础知识，掌握语法结构、语义理解、句法分析等 NLP 核心概念。

2. 精通常见的 NLP 任务与算法，包括：

（1）序列标注与实体识别：命名实体识别（NER）、词性标注、条件随机场（CRF）等。

（2）句法与语义分析：依存句法分析、语义角色标注等技术。

（3）情感分析与分类：能够基于机器学习方法开展文本情绪识别与分类。

六、综合技能

英语水平：CET-6

熟练Python、C#、Java等面向对象语言开发，MySQL、ES的应用，有良好的编程习惯

熟悉Linux操作系统下常用命令，熟悉shell、git、Visual Studio的使用

熟悉数据结构和算法设计、机器学习、数据挖掘等专业知识，了解TCP/IP通信协议

熟悉大模型Qwen、Baichuan、ChatGLM基于full、freeze、lora等算法的训练和推理

2020-07-01 -至今北京虾皮信息科技有限公司高级NLP算法工程师
主要研究神经机器翻译算法、大模型落地应用等工作。1. 具备丰富的大模型落地应用经验，能够结合实际业务场景将大模型技术应用于公文写作、Text2SQL 转换、标书生成等多个方向，推动业务智能化升级。 2. 熟悉主流大模型体系，包括 DeepSeek-R1、Qwen3、ChatGLM 等，掌握其在训练、推理、私有化部署以及国产化环境适配等方面的实践方法和优化策略。
2016-06-01 -2020-06-01百度数据研发工程师
主要研究K12教育数据的研发和教育知识图谱的搭建，包含教育数据的爬取，以及教育数据知识图谱的构建。对话机器人开发，文本分类、槽位抽取、阅读理解、文本匹配等想关工作

2014-09-01 - 2017-06-01中国科学院大学计算机科学与技术硕士

Python熟练

Shell熟练

深度学习熟练

自然语言处理精通

Torch熟练

作品

电商手机导购机器人系统

针对*商城业务，设计一个*导购机器人，该机器人系统主要包含文本分类、文本分类的人机协同、信息抽取模块、阅读理解、知识图谱、指代、容错、补全以及推荐模块等。工作内容： (1)设计开发文本分类和人机协同任务的代码逻辑，包含价格的分类、*的分类等，基于BERT预训练语言模型开发的分类模型指标F1-score:95%+; (2)设计开发关于基于*标签的推荐模块，主要是基于KG数据进行开发的，包含实体的识别，价格实体及极性的识别、热门机型的推荐、实体和*标签的归一化等功能模块。